地 址:江西省赣州市
电 话:0783-987219
网址:aylalighting.com
邮 箱:tinghuqu1460@163.com
本文来自微信大众号:盒饭财经(ID:daxiongfan),作者:赵晋杰,复被题图来自:视觉我国。大模
立志研制通用大模型底座的型绊李开复 ,正在堕入一场套壳Meta开源大模型LLaMA的李开质疑之中 。
近期,本年3月份从阿里离任投身AI大模型创业的大模贾扬清爆料称,在协助海外客户适配国内某一新模型中,型绊被朋友奉告该模型用的李开其实是LLaMA架构,仅在代码中更改了几个变量名。复被
虽然贾扬清并未点出开发上述新模型的大模具体公司称号,但种种痕迹都指向了李开复的型绊零一万物 。11月6日,李开零一万物刚刚发布了“Yi”系列开源大模型——Yi-34B和Yi-6B 。复被
针对外界质疑 ,11月15日 ,零一万物在回应盒饭财经中供认,在练习模型进程中 ,沿袭了GPT/LLaMA的根本架构 ,但“就零一万物的调查和剖析 ,大模型社区在技术架构方面现在是一个处于挨近往通用化逐步收拢的阶段,根本上世界干流大模型都是依据Transformer的架构……国内已发布的开源模型也绝大多数选用渐成职业规范的GPT/LLaMA的架构。”。
要是把模型练习进程比做一道菜 ,“架构仅仅是是决议了做菜的原资料和大致进程……要练习出好的模型,还需求更好的‘原资料’(数据)和对每一个进程细节的把控(练习方法和具体参数)。”零一万物进一步解释道 。
在贾扬清站出来爆料之前 ,有关零一万物仿照LLaMA架构的指控现已最初在开源社区内发酵。
9天前,convai高档人工智能运用专家埃里克·哈特福德在Huggingface上发帖称 ,“Yi-34B 模型根本选用了LLaMA的架构,仅仅是是重命名了两个张量。”。
8天后的11月14日 ,Yi团队开源总监Richard Lin在该帖下回复称