日本一品与二品-免费版片
    • 网站首页
    • 公司简介
      公司简介
      企业文化
    • 产品展示
      车载配件
      汽车专用电瓶
      汽车车载音响
      公司主营设备
    • 新闻动态
      公司新闻
      行业新闻
    • 成功案例
      成功案例
    • 客户服务
      售后服务
      技术支持
    • 人才招聘
    • 联系我们
      联系我们
      在线留言

    新闻动态Site navigation

    公司新闻
    行业新闻

    联系方式Contact


    地 址:江西省赣州市
    电 话:0783-987219
    网址:aylalighting.com
    邮 箱:tinghuqu1460@163.com

    网站首页 > 新闻动态
    新闻动态Welcome to visit our

    李开复被大模型绊了一跤

    分享到:
      来源:日本一品与二品-免费版片  更新时间:2023-12-10 08:43:05  【打印此页】  【关闭】


    本文来自微信大众号 :盒饭财经(ID:daxiongfan),作者:赵晋杰,复被题图来自:视觉我国 。大模

    立志研制通用大模型底座的型绊李开复 ,正在堕入一场套壳Meta开源大模型LLaMA的李开质疑之中 。


    近期,本年3月份从阿里离任投身AI大模型创业的大模贾扬清爆料称,在协助海外客户适配国内某一新模型中,型绊被朋友奉告该模型用的李开其实是LLaMA架构,仅在代码中更改了几个变量名。复被

    虽然贾扬清并未点出开发上述新模型的大模具体公司称号 ,但种种痕迹都指向了李开复的型绊零一万物  。11月6日 ,李开零一万物刚刚发布了“Yi”系列开源大模型——Yi-34B和Yi-6B 。复被


    针对外界质疑 ,11月15日 ,零一万物在回应盒饭财经中供认,在练习模型进程中 ,沿袭了GPT/LLaMA的根本架构 ,但“就零一万物的调查和剖析 ,大模型社区在技术架构方面现在是一个处于挨近往通用化逐步收拢的阶段,根本上世界干流大模型都是依据Transformer的架构……国内已发布的开源模型也绝大多数选用渐成职业规范的GPT/LLaMA的架构 。”。

    要是把模型练习进程比做一道菜 ,“架构仅仅是是决议了做菜的原资料和大致进程……要练习出好的模型,还需求更好的‘原资料’(数据)和对每一个进程细节的把控(练习方法和具体参数)。”零一万物进一步解释道 。

    在贾扬清站出来爆料之前 ,有关零一万物仿照LLaMA架构的指控现已最初在开源社区内发酵 。

    9天前,convai高档人工智能运用专家埃里克·哈特福德在Huggingface上发帖称  ,“Yi-34B 模型根本选用了LLaMA的架构,仅仅是是重命名了两个张量。”。


    8天后的11月14日  ,Yi团队开源总监Richard Lin在该帖下回复称 ,哈特福德对张量称号的观念是正确的 ,零一万物将把它们从Yi重命名为Llama 。

    在今日盒饭财经收到的最新回复中 ,零一万物说到:“关于沿袭LLaMA部分推理代码经试验更名后的忽略  ,原始起点是为了充沛测验模型,并非故意隐秘来历 。零一万物对此提出阐明,并表达诚挚的抱歉,咱们正在各开源渠道从头提交模型及代码并弥补LLaMA协议副本的流程中 ,许诺尽速完结各开源社区的版别更新。” 。

    李开复个人在今日下午也发朋友圈对此事做了回应 。


    素有国内“AI教父”之称的李开复,在大模型浪潮中收成外界寄予的更大希望之余 ,也不行避免迎来外界更苛刻的审视。

    一。

    虽然零一万物现已揭露供认其学习了LLaMA架构,但并不能就此直接给李开复的大模型扣上“套壳”或许“抄袭”的帽子。

    相同开发大模型的国内创业者李振告知盒饭财经 ,界定某一大模型是否存在套壳行为 ,取决于具体的完结细节和底层技术 。  。“要是零一万物大模型运用了与Meta LLaMA相同的模型架构、练习方法和数据集 ,那么它可能在某种程度上是套壳的 。可是 ,要是它运用了不同的技术或进行了额定的改善,那么就不能简略地说是套壳 。”。

    依据零一万物的声明 ,其投注了大部分精力调整练习方法、数据配比、数据工程、细节参数、baby sitting(练习进程监测)技巧等 。

    即使模型架构类似,但在不同的数据来历和数据练习方法加持下 ,终究练习出来的大模型功效仍然会体现各异。“前大模型年代,AI的干流是以模型为中心的单任务体系,数据根本坚持不变。进入大模型年代,算法根本坚持稳定 ,而数据在不断增强增大。”在工业专家刘飞看来,比较算法和算力,数据可能是眼下阻止国产大模型追逐OpenAI脚步的更大距离 ,“魔鬼都藏在这些数据练习的细节里。” 。

    特别值得一提的是,参数量的巨细与终究模型呈现的作用之间 ,两者“投入产出并不成正比,而是非线性的”。人工智能专家丁磊表明,“数据多仅仅是是一个定性,更重要的是检测团队数据清洗的才能 ,不然跟着数据增多  ,数据搅扰也将随之变大。” 。

    这也为新晋大模型团队以更小参数量 ,在功效上反超更大参数量的模型供给了某种理论可能性 。

    11月6日Yi-34B预练习模型发布后,李开复将其描述为“全球最强开源模型”,以更小模型尺度评测逾越了LLaMA2-70B、Falcon-180B等大尺度开源模型。


    Yi-34B。

    但跟着越来越多国产大模型在各类测验榜单中登顶,逐个逾越业界公认最强的GPT-4,有关这些大模型是靠实力拿下的高分 ,仍是凭借了刷榜方法  ,再次引发外界争议 。

    闻名大模型测验集C-Eval就在官网置顶声明 ,称评价永久不行能是全面的,全部排行榜都可能以不健康的方法被黑客侵略,并给出了几种常可可见的刷榜方法 ,如对强壮的模型(例如GPT-4)的猜测作用蒸馏 、找人工标示然后蒸馏、在网上找到原题参加练习会集微调模型等等。

    形成国产大模型屡登测验榜单榜首的一大客观缘故 ,在刘飞看来 ,是因此。到目前为止 ,并没有真实公认的客观评判规范和方法 。。刘飞说,上一代AI的“单任务模型”有公认的数据集作为黄金规范,但在新式的大模型年代,“因而大模型多任务、开放式的新特性 ,变得难以预先界说,数据质量的测验既深重 ,也难以全面。” 。

    不过 ,哪怕不少国产大模型是学习LLaMA架构练习而来 ,其对国内公司而言仍有不行取代的价值。

    李振表明,外部公司在接入一个大模型渠道时,除了考虑模型的功效和作用外,模型的开放性和可定制性也是需求考虑的重要因素,具体到某些区域,还要特别注重数据隐私和安全合规问题  。

    虽然目前国内公司可以直接接入Meta LLaMA模型 ,可是因而Meta LLaMA是一个世界性的大模型渠道,它需求恪守更多的世界法规和约束 。此外,要是涉及到灵敏范畴或数据,还需求取得特定的授权或答应 ,乃至不扫除海外开源技术随时关停 、切换高额收费或约束区域拜访的危险。因此在李振看来,比较冒险接入Meta LLaMA,国内公司直接调用国产大模型是更为经济合算的挑选 。

    二。

    经过学习LLaMA 根本架构,李开复的零一万物在练习模型速度上快速起步。

    本年3月,李开复正式宣告将亲身带队 ,建立一家AI2.0公司 ,研制通用大模型 。经过三个月筹办期,7月份,该公司正式定名“零一万物”,并组建起数十人的大模型研制团队 。团队成型四个月后,零一万物便在11月份推出了“Yi”系列大模型产品 ,并凭借Yi-34B霸榜多个大模型测验集。

    据出资界报导 ,在露脸大模型产品之际  ,零一万物已完结由阿里云领投的新一轮融资 ,投后估值超10亿美元,跻身我国大模型创业公司独角兽队伍。

    零一万物快速兴起的背面,离不开李开复的个人IP加持,就连官网都揭露感谢“李开复博士过往40年在人工智能范畴的科研和工业经历”。

    出任过谷歌全球副总裁兼大中华区总裁 ,并在微软全球副总裁期间开创了微软亚洲研究院的李开复  ,经过在2009年创建立异工场 ,完结了从明星工作经理人到VC出资人的身份改变 。

    曩昔十多年间 ,立异工场出资超越300多个项目,其间不乏旷视科技 、美图 、知乎、第四范式、地平线等职业闻名公司 。

    在2019年被晚点问及立异工场报答最好的基金是哪一期时,李开复答复:“投AI项目最多的报答最好……例如旷视报答400倍 、VIPKID报答1200倍 。” 。

    靠着数十年如一日对AI的宣传布道 ,李开复一度被称为我国的“AI教父” 。虽然其在AI方面的出资可圈可点,但李开复扮演的人物明显不同于山姆·阿尔特曼这样用划年代的产品来引领 AI 职业的企业家。

    在2018年9月推出的新书《AI·未来》中,李开复曾谈及中美两国竞赛距离,斗胆预言 :“人工智能实干年代竞赛力的天平将倾向商业化履行、产品质量 、立异速度和大数据 ,而这些要素恰是我国优于美国之处 。”在书中  ,李开复乃至写到 :“15年前从‘学习’起步的我国互联网草创公司从美国商业模式中取得创意,激地相互竞赛……当这一代我国企业家学会运用人工智能时,将完全推翻游戏规则。”。

    在ChatGPT引发的新一轮AI推翻性革新实际面前 ,越来越多人最初从头审察中美在AI方面的距离 。

    具体到大模型方面,丁磊乃至以为 ,比较算法、算力和数据  ,“真实有领导力的AI管理者,像山姆·阿尔特曼这样有才能推进新技术落地运用的技术管理人才,才是国内更缺的一块短板。”。

    三。

    除了需求向外界展示如阿尔特曼一般的高明技术管理才能之外 ,李开复的大模型梦还遭遇着许多应战  。

    怎样赶快追逐上OpenAI的脚步,是横亘在李开复等一众大模型创业跟随者面前的最大拷问 。

    在国产大模型日新月异的多半年间,OpenAI相同前进神速 ,相继推出了GPT-4 、GPT-4V 、GPT-4 Turbo 。

    阿尔特曼还在带领OpenAI继续狂飙。本年10月份 ,阿尔特曼初次对外清晰,OpenAI现已发动GPT-5、GPT-6的练习,并将继续沿着多模态方向继续迭代。

    在国产大模型还在尽力追上ChatGPT脚步之时,其比较OpenAI更先进模型的距离 ,反而有了逐步扩展的趋向 。

    值得一提的是,2020年发布GPT-3时 ,OpenAI曾具体揭露了模型练习的一切技术细节 。我国人民大学高瓴人工智能学院履行院长文继荣表明,国内许多大模型其实都有GPT-3的影子 。

    但跟着OpenAI在GPT-4上一改开源战略 ,逐步走向关闭,一点儿国产大模型就此失去了可供仿制的追逐途径 。

    放眼国内 ,即使声称做到了一众测验榜单榜首,但留给零一万物的应战仍难言达观  。

    在发布Yi-34B预练习模型后,李开复声称内部现已发动下一个千亿参数模型的练习 。与之比较,国内不少大模型公司现已完结了千亿模型的上市发布。

    除了需求提速追逐先行者外,怎样在商业落地上胜出,将是李开复需求处理的更大应战  。

    经历过AI 1.0 年代的李开复,在投身大模型创业后 ,便对外说到自己“做的运用必然是朝着可以快速有收入,并且可以发生非常好的赢利 、收入是高质量的 、可继续的 ,而不是一次性在某一个公司上打下一个单子 。”。

    完结上述商业化的突破口被李开复放在了C端运用上  ,李开复相同信任AIGC年代将诞生比移动互联网大十倍的渠道机遇 ,将呈现把既有的软件 、运用界面和运用重写一次,改写用户交互和进口的新机遇。“好像Windows带动了PC遍及,Android催生了移动互联网的生态,AIGC也将诞生新一批AI-first的运用 ,并催生由AI主导的商业模式。”。

    想要完结上述雄伟愿景 ,除了需求将旗下通用大模型打造得满足先进之外 ,还需求在一众国产大模型竞赛中锋芒毕露。

    恒业本钱开创合伙人江一以为,这波AI大模型浪潮中,国内终究可以存活下来的通用大模型玩家,“可能有个3家就现已不错了。因此练习大模型需求许多投入  ,要烧许多钱 ,并且还不必然能追得上GPT-4。” 。

    不管Windows仍是Android  ,每个年代也仅仅是拼杀出了一个,李开复该怎样让零一万物成为AIGC年代的“仅有”呢 ?

    本文来自微信大众号:盒饭财经(ID :daxiongfan) ,作者 :赵晋杰 。

    本内容为作者独立观念,不代表虎嗅态度。未经答应不得转载 ,授权事宜请联络 hezuohuxiu.com 。

    上一篇:大人小孩都爱的马铃薯虾球
    下一篇:徐兴无:如将不尽,与古为新——序《沙公临古》

    相关文章

    • 胶东有啥好吃的?冬天吃牡蛎正当时,又鲜又肥!
    • 现在买很划算,销量再破万的伊兰特能带领北京现代逆袭吗?
    • 全案软装设计案例
    • 罗马诺:尤文研究与桑德罗提前解约,球员可能今夏自由离队
    • 我国成功发射卫星互联网技能实验卫星
    • 巴勒斯坦男模为 PRADA 拍摄广告,被 Bella Hadid 认做干弟弟!
    • 多特季前赛安排:7月5日开始训练,将在美国对阵曼联、切尔西
    • 40岁的女人更要重视发型,选择波波头和低盘发,大方利落又清爽
    • 被斗鱼索赔8000万的女大学生:违约者仍是猎物?
    • 贝弗利:唐斯是现役第一中锋 进攻端天赋他第一哈登第二

    友情链接:

    公司简介|产品展示|新闻动态|成功案例|客户服务|人才招聘|联系我们

    Copyright © 2023 Powered by 日本一品与二品-免费版片  sitemap

    0.1572s , 10549.8828125 kb