第2045章 AI改变世界_大时代之巅

据量太少，中文的数据量很大，可是因为环境的限制有价值的数据也很少。

所以，想训练出世界级的AI模型，就只能用英文语料来训练。

这就需要一些弱势语言的AI模型，要有语言转换能力，去转换成英文。

就像使用文心一言，让他画一个起重机的图片。

结果画的是鹤。

这就很让人费解。

其实很简单，起重机的英文是crane，而crane在英文里主要是指鹤。所以AI模型就画出了鹤的图片。

又比如“可乐鸡翅”这种，放在中文语境里，其实很好理解，就是一道菜。可是，这里面有一道翻译的手续，把“可乐鸡翅”翻译成英文，在翻译过程中就造成了信息离散，导致画出来的可乐和鸡翅。

ChatGPT一样会遇到这样的困境。

用英文向ChatGPT提问，回答的速度会非常快，而且准确度极高；如果用中文、日文、韩文、法文、德文等其他语言来提问，反应速度就会很慢，给出的答案也会错误百出。

因为其他语言的数据量太小了，训练出的模型就不够智能。

只有英文版最智能。

文心一言想要表达得智能一些，就不能对接中文的语料，要去对接英文的训练数据才行，然后背后再增加一套翻译算法和内容审查算法。

所以，想做出一款伟大的AI产品，除了在人工智能领域的顶尖算法之外，还有很重要的一个因素，就是训练AI模型的数据。

这些数据里，有些是开源的公共数据，全世界都可以用。有一些是私有数据，只有自己可以用。

像微软、谷歌、Facebook这种硅谷的巨头公司，除了可以使用庞大的公有数据外，还有庞大的有价值的英文私有数据可以使用，他们做出来的AI模型就会比只根据公有数据训练的AI模型要更加强大。

所以，周不器对内容很重要，尤其是海外的英文内容。

这些都是私有数据，都有可能成为紫微星在未来世界竞争中最宝贵的资产。

如果拉里·佩奇说的这款Knol真的是对标维基百科的产品，那就太有意义了。维基百科是公有数据，Knol就是私有数据。

“维基百科更像是一个词典，内容都比较基础，是偏大众的产品。Knol是由一部分有能力的权威用户来共同协作，用来解释一件事物的是什么、怎么做、起因经过结果及其周边事物，并且

　　本章未完，请点击下一页继续阅读！

看了《大时代之巅》的书友还喜欢看

家兄嬴政，谁敢杀我？

作者：黑茶芝士

简介：家父庄襄王，夺城五十余座、攻灭东周！家兄秦始皇，横扫六国、一统天下、威加海内！

更新时间：2024-11-25 18:00:00

最新章节：第1029章嬴成蟜：群儒弃秦？还有这等好事！当然是原谅他了！

葬神棺

作者：浮生一诺

简介：【传统玄幻】【背景逆天】【剑修】【无系统】亿万年前，鸿蒙时代，混沌初开，宇宙本源为了...

更新时间：2024-11-24 17:47:32

最新章节：第1116章你们疯了吗？敢惹这个煞神！

我给高祖当儿媳

作者：冷青衫

简介：网文填坑节来袭,独家番外连载爆更,大佬包场免费看。能文能武没落士族大小姐VS老爹让我...

更新时间：2024-11-25 18:05:00

最新章节：第1146章十余军中，寻一人

重回八零，我破了命案九千宗

作者：钓月耕云

简介：重回八零年代，陈青峰带着上一辈子的遗憾重新经历了之前尚未侦破的九千宗命案。
...

更新时间：2024-11-25 18:00:25

最新章节：第749章马耳他调查

我的1995小农庄

作者：叶公好龙A

简介：陈凌带着一块仙家福地回到了1995年，面对无数发达致富成为人上人的机会，陈凌却不想努...

更新时间：2024-11-25 18:11:00

最新章节：第七百九十九章准备杀猪

末世天灾：囤积女神空间百亿物资

作者：一只酷茄子

简介：【末世+重生+囤百亿物资+无限空间+多女主+苟+不圣母】天灾降临，太阳熄灭。

更新时间：2024-11-25 18:00:24

最新章节：第708章五大势力大获全胜