应该有人敢挑战GPT—3的垄断地位!
应该有人敢挑战GPT—3的垄断地位!
GPT—3自问世以来已经成为最大的AI语言模型之一。
不仅可以为Python深度学习写邮件,写文章,创建网站,甚至生成代码。
最近,一个侏罗纪模型声称能够击败GPT—3。
谁这么有勇气,居然敢喊。
不是侏罗纪公园的恐龙!是侏罗纪—1 Jumbo,还在测试中!
现在,您还可以免费体验它:
除了能够将Python代码转换成Javascript之外,这种语言模型还有什么了不起的。
大胆,但强大
在机器学习中,参数是模型的一部分,从历史训练数据中学习。
一般来说,在语言领域,参数越多,模型越复杂。
侏罗纪—1巨型模型包含1780亿个参数。
突然之间,GPT—3有了30亿个参数!
GPT有5万个词汇项目。
可是,侏罗纪—1可以识别25万个表情,单词和短语。
覆盖范围比包括GPT—3在内的大多数现有型号都大。
侏罗纪—1模型已经过云训练,一个公共服务上有几百个分布式GPU。
Token是一种在自然语言中将文本片段分成更小单元的方法,这些单元可以是单词,字符或单词的一部分。
侏罗纪—1训练数据集有3000亿个token,都是从维基百科,新闻出版物,StackExchange等英文网站编译而来。
模型的训练采用传统的自监测和自回归形式,从公共资源中训练3000亿代币。
在优化程序方面,研究人员对J1—Large和J1—Jumbo分别使用了1.2次10—4和0.6倍,10—4,批量大小为200万和320万代币
每个字节的平均对数概率表明该模型在不同领域的适用性
研究人员说,在几乎所有的语料库中,侏罗纪—1模型都领先于GPT—3。
在小样本学习的测试上,各有输赢,但两个模型的平均分是相等的。
在基准测试中,侏罗纪1号在回答学术和法律问题上的表现与GPT 3号相当,甚至更好。
GPT—3需要11个令牌,而侏罗纪—1只需要4个令牌,大大提高了样本效率。
当然,对于语言模型来说,最难的问题是逻辑和数学。
而侏罗纪—1 Jumbo可以解决两个大数相加这个非常简单的算术问题。
侏罗纪可以解释一个词的意思
面对各种语言模式,侏罗纪—1 Jumbo只能算是后起之秀,并不是什么新奇的模式。
但是和它的前辈类似,如果问题不清楚,大概率的答案不是你想要的。
堪称产品经理的终结者。
即使是自己的人在有偏见时也会战斗
侏罗纪—1模型由AI21实验室开发,将通过AI21实验室的Studio平台提供服务。
开发人员可以在公共测试版中构建应用程序原型,如虚拟代理和聊天机器人。
此外,在公测版中,侏罗纪—1模型和Studio也可以用于解释和总结,例如从产品描述中生成简短的产品名称。
根据内容对新闻进行分类
同时,开发者也可以训练自己的侏罗纪—1模型,甚至只需要50—100个训练实例。
经过培训,可以通过AI21 Studio使用这个自定义模型。
可是,《侏罗纪—1》也面临着其他语言模式的痛点:对性别,种族,宗教的偏见。
由于模型训练数据集在一定程度上存在偏差,训练出来的模型也会学坏。
一些研究人员指出,GPT—3和其他类似语言模型生成的文本可能会强化极端右翼极端主义的意识形态和行为。
侏罗纪模型的输出面临预设场景的问题
有鉴于此,AI2实验室正在限制公共测试版中可以生成的文本量,并打算手动审查每个微调模型。
可是,即使是微调的模型也无法摆脱训练过程中的坏习惯。
就像Open AI的Codex一样,它仍然会生成种族主义或其他令人反感的可执行代码。
虽然是以色列研究人员开发的,但很可能受到训练数据集的影响《侏罗纪—1》似乎比《GPT—3》更歧视犹太人
在偏见和歧视的问题上,所有的模式都是釜底抽薪。
可是,AI21实验室的工程师表示,侏罗纪—1模型的偏差小于GPT—3。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
版权声明:凡注明“来源:“生活消费网”的所有作品,版权归生活消费网 | 专注于国内外今日生活资讯网站所有。任何媒体转载、摘编、引用,须注明来源生活消费网 | 专注于国内外今日生活资讯网站和署著作者名,否则将追究相关法律责任。
-
实现种源自主可控中国两部门联合印发现代种业提升规划下决心打一场种业翻身仗记者12日从中国农业农村部获悉,最近几天,国家发展改革委,农业农村部联合发布《十四五现代种业提升工程建设规划》,对十四五期间我国现代种业升级工程建设进行全面部署种业是农业的芯片,是否先进关系到农业现代......2021-08-12 19:08
-
机器学习等人工智能项目优秀的求职者在求职时更有竞争力更容易被企业追捧全球专业招聘集团轩尼诗最近几天发布2021年《中国大陆科技行业报告》,称中国在人工智能领域处于领先地位,拥有全球近60%的大数据专家可是,伴随着行业的不断细分和新赛道的快速发展,人才的供给侧和需求侧存......2021-08-12 19:02
-
本次减持的王南斌不属于公司控股股东或实际控制人8月11日晚间,三生公告称,公司于当日收到王南斌的《关于股份减持计划实施结果的告知函》,截至公告日,王南斌减持计划期限已届满。 2021年5月25日至2021年8月10日,王南斌减持公司股份432万......2021-08-12 18:59
-
中国人寿保险公告公司2021年1—7月累计原保险保费收入约4689亿元宁波云升:7月以来,公司使用的主要原材料价格持续上涨 连续三日跌停的宁波云升公布,今年7月以来,公司使用的主要原材料价格持续上涨,其中金属镨钕价格较一个月前上涨超过30%,其价格波动直接影响公司生产......2021-08-12 18:58
-
2.中国智能汽车行业目前的市场形势和企业日益激烈的竞争格局仍不稳定1.DJI进入汽车行业提供自动驾驶系统 日前,DJI正式推出智能驾驶业务品牌DJI汽车,致力于用空间智能技术赋能出行,专注于R&D智能驾驶系统及其核心零部件的生产和销售DJI汽车将于4月19日在上海......2021-08-12 18:56