在人类所具有的独特性之中,创造力理应占据一席之地。在我们之前的认知中,它是人类特有的一种综合性本领。正是创造力,让我们区别于所有生物,成为唯一改变整个世界面貌的种群。
但是这一独特性,似乎正在面临挑战。
把西班牙超现实主义画家达利(Dalí)的字母D,加上皮克斯动画工作室制作的第九部动画片WALL-E(一个被人类遗留在地球上的孤独的机器人)的名字拼在一起,就是我们今天的主角DALL·E,OpenAI发布的最新神经网络模型。
在此之前,此类模型拥有的最高成就是生成文本,如2020年5月发布的那一款GPT-3(第三代生成式预训练Transformer),它能写文章写简历,还能能生成代码、做数学推理,这已经足够令人震惊。
但是DALL·E则不同,它是一个具有120亿个参数GPT-3,能从大数据中调取从文本描述的信息,然后直接生成一幅合情合理的图像。
这意味着什么呢?
首先,它能听懂你的话,并且拥有图像创作能力。
比如,输入“一只穿着芭蕾舞裙的小白萝卜在遛狗”:
或者“一只戴墨镜的狐狸宝宝在滑冰”:
其中有几只还是蛮可爱的!
表情生成对DALL·E来说更是轻而易举,比如“一只睡不醒的猫头鹰”:
甚至,还能根据你描述的场景生成不同画家风格的作品,虽然有些像小孩子的练习,但是它似乎真的可以把握我们所描绘的意境。
“立在山顶的鹰”:
除了绘画能力,它还能通过理解文本,输出如同照片一样的画面。
“一个粉色的马桶(有几张图片,粉色看出来了,六边形呢?)”:
能用不同的质地展现物体,“一朵四面体的云”:
或者“一排钟表摆在桌子上”:
同时,DALL·E还能基于图片,对已有的图像进行创作。对于以往的神经网络模型而言,“绘制和顶图一致的作品”是一个非常困难的事情,但是经过适当的培训,DALL·E做到了这一点:
更有趣的是它将不同的物种结合,创作出世界上没有的神奇物种。(玩到停不下来)
一只“羊驼猫”:
“一只刺猬汉堡”,这个超可爱:
它还是一个惊人的设计师。
你只需要输入“牛油果外形的灯”,就可以得到许多款式:
室内装饰也一样,“米色的咖啡休闲区背后放一幅仙人掌挂画”:
DALL·E也对时尚领域发起了挑战,如果你需要一个“穿着红色夹克和黑色裤子的男模特”:
或者一个穿着“红色裹裙和黑色夹克的女模特”,它都可以满足你,
最令科学家意外的,是它拥有几何学习能力,这种能力常常被用于人类的智商测试:
它也掌握了地理知识和世界各地的风物。但有时也会翻车。
比如中国的动物,凡是黑白就看做熊猫,第一个明明是暹罗猫,最后一个又是什么玩意?
还深度了解不同年代物品的发展变迁史:
在这些案例中,我们能看到DALL-E拥有出色的理解能力,这并不算惊人,但是这些图片展现出混合概念的能力,这是否意味着DALL-E拥有了创造力,就和人类一样?
乔治亚理工学院的Mark Riedl教授就是这样认为的:“混合概念的能力是人类创造力的关键。所以,DALL-E的确在创造力上有了很大的进步。虽然人们对AI是否真的理解概念看法不一,但用新的方式创造东西,的确是是创造力的证明。”
这个拥有120亿参数的智能模型,这是人工智能的一次相对成功的尝试,但机器拥有创造力,听上去有点让人毛骨悚然。随着AI算法和自动化的快速发展,我们曾经看过的那些关于AI毁灭人类的故事,似乎都在成为现实。
怎么办呢?梵蒂冈的教皇给我们做出了榜样。教皇方济各致力于新兴的AI技术,但这是他的祈祷词:“我们祈祷机器人技术和人工智能的进步,将永远为人类服务。”
那么在对未来机器人称霸世界的担忧中,我们决定一边祈祷,一边去OpenAI的官网玩玩看(https://openai.com/blog/dall-e/)。
本文所有图片素材均来自OpenAI官网互动截图