而真正使得Character.AI持续不断吸引新用户、让老用户不断沉迷的王牌功能,其实应该是——自创AI角色聊天,AKA AI cosplay。为了体验一下这个应用的中文能力,小编顺手建立了两个自己的AI角色。第一个角色非常简单,介绍里我就添加了一条招呼语,一个即将加盟皇马的足球运动员AI就生成了。第二个角色,我决定稍微倾注一点心血。回忆起了人生中玩过的第一个电脑游戏《阿猫阿狗》中的主人公,我用自己仅有的一些关于他的记忆片段把他创建了出来。创建完毕之后,我先试着和足球球星简短地聊了聊。因为我自己对这个角色几乎没有做任何的设定,他的回复对于我来说几乎就是随机的。第二句回复就直接出现了「国骂」,让我猝不及防。当我把角色描述增加了,友善,喜欢和队友配合之后,聊天的画风才慢慢开始正常了起来。接着我又开始和我心心念念的「游戏白月光」聊了一阵。果然,因为我描述得比较充实具体,乐乐能回复不少我记忆中游戏里的细节。虽然很多内容是他自己生成的,但是基本还原了描述中的游戏角色。让小编回忆起小时候那段做完家庭作业玩《阿猫阿狗》的欢乐时光,泪目了。也许这个角色会很长时间的保留在我的手机之中,当我想起一些游戏细节的时候会继续再填充进去。有空了就还能和乐乐聊聊天,共同回忆一下在木桶镇经历的那些冒险故事。
利用「20%时间」,他们创造出10亿独角兽的雏形
Character.AI才成立不到2年,融资就接近2亿美元,一个初创企业能这么被投资人看好,创始人的身份必然是一大因素。没错,Character.AI的创始人Noam Shazeer和Daniel De Freitas,就来自大名鼎鼎的谷歌LaMDA团队。Noam Shazeer是一名已经在谷歌工作超过20年的老兵。Character.AI背后的原理,就是使用神经语言模型来阅读大量文本,并使用该信息响应提示的。创始人Noam Shazeer和Daniel De Freitas此前在谷歌构建了支持对话程序的语言模型LaMDA,就是这个模型,引发了随后引起轩然大波的「谷歌程序员坚称LaMDA有意识」事件。如今经受了ChatGPT等大模型的高能洗礼,我们早就对此习以为常,但当时,此事可是让很多人san值狂掉。2015年,当时在微软担任软件工程师的De Freitas读到了谷歌旗舰AI实验室Google Brain的科学家发表的论文。就是在这篇论文中,研究者详细介绍了一种「神经对话模型」 ,展示了机器如何通过分析数百部电影的对话记录,来学习对话艺术。论文地址:https://arxiv.org/pdf/1506.05869.pdfDe Freitas读到这篇论文时,还不是AI研究院,那时他是从事搜索引擎工作的软件工程师。他真正想要的是,把谷歌的想法发挥到逻辑的极致。「你可以让这个机器人去概括。它说的话看起来并不像电影中的台词。」17年,De Freitas加入了谷歌,成为Youtube的一名工程师。谷歌的传统是,每个人都有一个「20%时间」项目,可以在完成日常任务后探索新想法。在「20%时间」里,De Freitas开始构建自己的聊天机器人。为了用更大的对话集合(比如从社交网络上挑选出的大量聊天记录)训练神经网络,他需要巨大的算力。好在,作为谷歌工程师,他拥有一些积分,可以在公司的计算机数据中心网络中运行软件。但很快,算力不够了,他只能向其他工程师借积分。随着系统分析的数据越来越多,聊天机器人的技能也随之突飞猛进。起初,De Freitas用的是LSTM神经网络训练机器人,随后,他很快转向了谷歌团队开发的Transformer神经网络。与LSTM一次读取一个单词的文本不同,Transformer可以使用多个计算机处理器,在一个步骤中分析整个文档。很快,他创造出了聊天机器人Meena,谷歌注意到了他的项目,把它升级为官方的研究。后来,Menna就成为了LaMDA。
婉拒劈柴,出走谷歌,走上人生巅峰
「工程师声称LaMDA有意识」事件后,谷歌不愿意发布这项技术,因为担心错误信息和有毒言论会损害谷歌的品牌形象。因此, Shazeer和Daniel De Freitas萌生了去意。有消息称谷歌CEO曾亲自出面挽留两人,希望他们继续致力于LaMDA的开发,但没有承诺向公众发布聊天机器人。于是两人于2021年底离开了谷歌,并于当年11月成立了他们的初创公司Character Technologies Inc.,推出了Character.AI。2021年12月,该公司筹集了4300万美元的种子资金。在创始人的领英介绍上,他几乎参与了5年来和谷歌所有大语言模型的项目,成绩斐然。这种级别的技术大佬出来创业,自然是拿钱拿到手软。参与投资的机构和个人包括A16Z,SVA,Gmail之父Paul Buchheit等。直到现在,公司团队还只有30人,十分忙碌。另外,它还宣布与Google Cloud建立了合作关系。使用Google Cloud的张量处理器单元,公司就可以更快、更有效地构建和训练大语言模型。