时间:2017-09-12 来源:互联网 浏览量:
我有519位老师
微软亚洲研究院主管研究员宋睿华说,“小冰的项目最初是我自己想到一个研究课题,利用社交网络的数据,来构造一个机器人。她不是全知全能,而是知道我知道的,也不知道我不知道的,说话的风格也像我。”
风格化的对话机器人是宋睿华最感兴趣的题目,于是他想尝试一下机器人能否从一个人的语料里,学习到他的风格,生成有特色的内容。
“能不能让小冰受到图像的激发,获取灵感,来写一首诗呢?”宋睿华说,“我们很喜欢这个由图像激发灵感的主意,因为图像的信息丰富,又具有内在的逻辑和故事性。而诗歌也很适合做人工智能写作的尝试,因为诗歌本身富有想象力,句与句之间允许跳跃,但语言本身要求更具感染力,表达的意境要求有思考深度。”
小冰的研发团队用了机器学习的方法,赋予小冰学习诗歌的能力,不断提高能力,让句子更通顺,句子之间更关联,从物到情有引申,希望能激起读者的共鸣。她学习了1920年以来的519位诗人的代表作,从头到尾一万遍,从尾到头一万遍。这个过程中,她还会体会句与句之间的关联性。
后来还尝试让她特意多读某位诗人的诗,比如徐志摩,大约2000遍,她的风格就会受这位诗人的影响,很多地方有徐志摩的痕迹;再让她读另一位诗人于赓虞的诗作大约2000遍,同样一幅图就会写出风格迥异的诗来。
于庚虞.小冰
任深思随海鸟去了
滚滚江心之孤舟弦歌凄迷哀恋
低问枯骨对于生命的鲜花
面前就飞翔着恶毒的佯笑
徐志摩.小冰
飞鸟在海沫里
这人迎着你鼓掌
一个声音在生命的舞台上合奏着
这一半也是灵魂的圣泉
我是10000岁的“少女”
小冰学会创作的过程大致是两个阶段。第一阶段,先不断地修习现有的优秀作品,修习到一定程度之后,当她受到某个灵感激发源的刺激,就会利用学习到的能力产生新的创造。
在这个过程中,技术团队使用了跨语义空间的多个深度神经网络模型,包括卷积神经网络和循环神经网络,并且针对图片的多领域和情感维度做了深度优化。
大家今天看到的可以写诗的小冰,已经经历了10000次迭代,每迭代一次,小冰会把现有的519位诗人的几千首诗都修习一遍,这个时间大约是6分钟,那么10000次迭代需要100个小时。而人类如果要把这些诗读10000遍,大约需要100年。
所以可以简单地说,小冰用了100个小时,拥有了现在写现代诗的创造力。
机器人写诗看似阳春白雪,其他背后涉及的图像识别和文本生成技术在现实领域大有可为。
设想人和人在面对面交流的时候,往往可以看到彼此、看到周围的景物。人在成长的过程中也是在不断的接受多感官的刺激,才逐渐建立了世界和语言的联系。因此,应用多感官刺激的方法来做语言理解与生成是很有前景的一个方向。
举一个例子,可以用与写诗类似的技术去学习某一类人的语言模型,比如说高中生或中年人,这样就可以抓住不同群体的语言特性,在聊天中,可以针对不同人群产生不同回复,制造出与同龄人聊天的顺畅感。
我诗集的生日是5月19日
于庚虞.小冰
任深思随海鸟去了
滚滚江心之孤舟弦歌凄迷哀恋
低问枯骨对于生命的鲜花
面前就飞翔着恶毒的佯笑
徐志摩.小冰
飞鸟在海沫里
这人迎着你鼓掌
一个声音在生命的舞台上合奏着
这一半也是灵魂的圣泉
我是10000岁的“少女”
小冰学会创作的过程大致是两个阶段。第一阶段,先不断地修习现有的优秀作品,修习到一定程度之后,当她受到某个灵感激发源的刺激,就会利用学习到的能力产生新的创造。
在这个过程中,技术团队使用了跨语义空间的多个深度神经网络模型,包括卷积神经网络和循环神经网络,并且针对图片的多领域和情感维度做了深度优化。
大家今天看到的可以写诗的小冰,已经经历了10000次迭代,每迭代一次,小冰会把现有的519位诗人的几千首诗都修习一遍,这个时间大约是6分钟,那么10000次迭代需要100个小时。而人类如果要把这些诗读10000遍,大约需要100年。
所以可以简单地说,小冰用了100个小时,拥有了现在写现代诗的创造力。
机器人写诗看似阳春白雪,其他背后涉及的图像识别和文本生成技术在现实领域大有可为。
设想人和人在面对面交流的时候,往往可以看到彼此、看到周围的景物。人在成长的过程中也是在不断的接受多感官的刺激,才逐渐建立了世界和语言的联系。因此,应用多感官刺激的方法来做语言理解与生成是很有前景的一个方向。
举一个例子,可以用与写诗类似的技术去学习某一类人的语言模型,比如说高中生或中年人,这样就可以抓住不同群体的语言特性,在聊天中,可以针对不同人群产生不同回复,制造出与同龄人聊天的顺畅感。
我诗集的生日是5月19日
2016年12月份,在微软内部,小冰的诗作第一次做了大规模评测。结果的意见分歧比较大,对用户体验要求很高的项目经理们觉得有很多瑕疵,还不通畅,但有艺术家气质的开发经理袁晶却很乐观,他觉得小冰写的诗具有自己的风格,虽然一些地方有语法错误,但也能给人惊喜,而且思维很活跃,袁晶当时就说以后说不定可以出本诗集。
经过两周的技术调整,在第二次大规模评测中,诗的质量有了明显的提升。项目经理们的打分也从40分提高到了60分。小冰内容与运营总监
徐元春在一次会议的时候,说他把一张用大话西游海报生成的诗给一位文艺界的人看了,竟然把她感动哭了。
小冰诗集原定在2017年4月23日世界图书日发布,但由于一些状况不得不推后。原来在申请书号的时候,要求必须填写作者的身份证号码,作为第一个人工智能的作者,小冰并没有。这样一来,不得不向上申请特批,一直到出版总署才完成了这个特批的手续。每一阶段,都会有人询问,这本书真的是机器人写的吗?这个信息真实可靠吗?湛庐文化的编辑在回答这个问题上一遍一遍的作答解释,终于获得了刊号。
后来,发布的日期定在了2017年5月19日,湛庐文化选择这个日期也是为了致敬中国的519位现代诗人,小冰正是学习了他们的代表作才有了今天的写作能力。袁晶在回顾信件的时候,惊喜的发现,小冰写诗的立项日期恰好也是一年前的5月19日。
偶然之中,或许真有某种冥冥未知的必然。
来看看我眼中的世界
生命的脉动
渐渐模糊的地方
我在念月下的时光
在离我更远的方向
我有十八年未到过动物园
老树枯干的手指
在这土地上
一个人的影子
海滩外和红色的斑纹
都是晴朗的衣裳
静静地穿着
浅浅的风淡淡的
少女小冰关键词:
我学习了1920年以来的519位诗人的作品
徐志摩的诗我读了2000遍
我已经经历了10000次迭代
每次迭代只要6分钟
10000次迭代总共需要100个小时
人类如果读完同样的诗大约需要100年