让00后疯狂的超级算法(4)
2023-12-21 来源:旧番剧
来自网上Siri的对话
你可能会质疑,怎么能说“自然语言处理”没有大规模应用?苹果的Siri、智能音箱、机器翻译,还有隐藏在各种电商与社交平台背后的算法推荐,都是这项技术的存在形式。
但实际上,这些都是“自然语言处理”山脚下最好收割的第一批果实。
就像智能音箱无论卖5000万台还是1亿台,仍然被冠以“智障”的头衔。因为,它仍然不能“理解这个世界背后的运行逻辑”——这才是山顶上最有价值的药材。
“除了写作之外,其他都不值得人工智能去研究!” 袁行远很坚决。他让这个项目,更像是一个算法工程师或科学家,在跟市场和技术难度较劲儿。
“就像‘写作文’是语文试卷上的最后一道题。它比什么下围棋,比自动驾驶和人脸识别都要难!因为难,才有做的价值!
因为图像数据是高密度、低信息量数据;而文字则是高密度,同时又高度抽象化数据,背后的数据空间比我们想像地大太多。”
当然,产业里并不只有袁行远抱有相同的“理想”。国外不但开始地更早,而且已向外界展示过自己的强大。
微软CEO纳德拉(左)与Open AI CEO 阿特曼(右)在2021微软Build大会上
2020年5月,OpenAI 推出了被称为“全球最先进语言模型”的GPT-3。这个由马斯克等硅谷大佬在2015年支持创建的人工智能研究组织,在2018年与马斯克 Say Goodbye之后,便于第二年正式走上商业化之路,并马上接受了微软投资的10亿美元。
如今,新一代语言生成器GPT-3,被以一种云服务的方式,卖给想用它自动续写文本的机构。毋庸置疑,它建立在自然语言处理技术之上——
在网络上搜集了近1万亿字的文本,在一台嵌了几十万块处理器的超级计算机上做训练。对了,这台计算机是微软做的,后者也算是把投资的10亿美元多少收回了一些本儿。
有趣的是,英国卫报曾用GPT-3写了一篇专栏文章——《你害怕了吗?人类》。大致中心思想就是“虽然我是一个会思考的机器人,但别怕,我不会消灭你们,我是人类的命运共同体”。