快科技 1 月 13 日音问,马斯克在 CES 技能接纳采访时指出九游会体育,实验宇宙能用来磨练 AI 模子的尊府,仍是破钞的差未几了。 马斯克清楚,基本上,AI 磨练仍是将东谈主类累计的常识全数耗尽,而这个时刻点便是客岁(2024 年)。 马斯克的这一不雅点呼应了 OpenAI 前科学长 Ilya Sutskever 在客岁 12 月机器学习会议" NeurIPS "上的说法,Sutskever 其时清楚,AI 产业大略破钞的数据仍是达到了顶峰。 濒临实验宇宙数据的零落,马斯克示意合成数据(
快科技 1 月 13 日音问,马斯克在 CES 技能接纳采访时指出九游会体育,实验宇宙能用来磨练 AI 模子的尊府,仍是破钞的差未几了。
马斯克清楚,基本上,AI 磨练仍是将东谈主类累计的常识全数耗尽,而这个时刻点便是客岁(2024 年)。
马斯克的这一不雅点呼应了 OpenAI 前科学长 Ilya Sutskever 在客岁 12 月机器学习会议" NeurIPS "上的说法,Sutskever 其时清楚,AI 产业大略破钞的数据仍是达到了顶峰。
濒临实验宇宙数据的零落,马斯克示意合成数据(synthetic data)将是将来的发展倡导。
他指出,补充实验宇宙数据的独一才略便是合成数据,由 AI 自行生成用于磨练的数据,通过合成数据,AI 将大略为我方打分,并张开自我学习的历程。
事实上,好多科技巨头仍是启动使用合成数据来磨练 AI 模子,微软、Meta、OpenAI 及 Anthropic 等企业仍是在其 AI 模子磨练中鄙俗应用合成数据。
科技市集盘考机构 Gartner 揣测,2024 年 AI 及分析容颜使用的数据中,约 60% 是合成数据。
举例,微软在 1 月 8 日开源的 AI 模子" Phi-4 "便是通过合成数据纠合实验宇宙数据进行磨练的,谷歌的" Gemma "模子也接管了同样的才略。
Anthropic 使用部分合成数据开荒了进展最好的系统之一" Claude 3.5 Sonnet ",而 Meta 则欺诈 AI 生成数据来微调其最新推出的 Llama 系列模子。