河洛网首页 新闻 关注 房产 汽车 教育 健康 婚庆 家居 旅游

| 人工智能

娱乐 体育 财经 科技 人工智能

OpenAI另一个“重磅炸弹”:赋予AI艺术创造力

来源:河洛网    发布时间:2021-02-02     发布人:洛阳新闻网

OpenAI再次投下了重磅炸弹。

OpenAI另一个“重磅炸弹”:赋予AI艺术创造力

本月初,去年夏天发表了人气语言模型GPT-3的OpenAI研究小组再次发表了新的AI模型DALL-E。 虽然比不上GPT-3,但很可能会对AI未来的发展产生更深的影响。

也就是说,DALL-E可以将文本描述作为输入,据此生成原始的图像输出。 ( DALL-E这个名称来源于超现实主义艺术家萨尔瓦多·。 达利和皮克斯工作室塑造的可爱机器人形象WALL-E表示敬意。 )

例如,如果输入&ldquo,则为五边形绿色时钟” “ 火球” 或“ 建筑物墙面上的蓝色南瓜壁画&rdquo然后,DALL-E可以生成惊人的准确的视觉效果。

▲生成请求中“ 建筑物墙面上的蓝色南瓜壁画&rdquo随后,OpenAI的新深度学习模型DALL-E可以生成上述原始图像

为什么DALL-E很重要?

首先,它预示着所谓的&ldquo。 多模式AI” 的新AI范式的出现。 这个范式似乎代表着人工智能的未来面貌。 以DALL-E为例,多模式AI系统通过解释、合成和翻译多个信息模式,可以映射情景、语言和图像。 虽然DALL-E不是第一个多模式AI方案,但它有着迄今为止最惊人的效果。

OpenAI联合创始人Ilya Sutskever总结说,“ 这个世界不仅仅由文字构成。 人类因表现过度而诉诸视觉。 视觉要素非常重要。 ”

目前存在的大部分AI系统只能处理一种数据类型。 自然语言处理模型( NLP模型),如GPT-3,只能处理文本。 计算机的视觉模型(例如面部识别系统)只能处理图像。 但是,人脑表现出的智能明显适应性强,能够处理的信息也更灵活。

人类可以从五种感觉中不断接收和整合信息— — 我们通过视觉、听觉、触觉、嗅觉和味觉的结合来理解周围的世界。 基于此,我们以声音、文本、肢体表现、表情、音乐等多种形式向这个多彩的世界传递信息。

DALL-E通过结合自然语言的理解和视觉表达的生成能力(也就是“阅读”和“视觉”的结合),再次证明多模式AI所蕴含的巨大可能性。

这才刚刚开始。 在接下来的几个月到几年中,新的AI系统有望无缝地将音频、视频、音频、图像、书面文本、触觉和其他要素联系起来。 随着AI学会越来越复杂,结合许多信息,了解世界,产生新洞察的能力也会爆炸性地增加吧。

DALL-E还有一个等级。 换句话说,有更根本的重要意义。 人类越来越不能否定人工智能中蕴含的巨大创造性。

DALL-E生成的图像远远超出了人类的想象力范畴。 这不仅仅是简单地修改互联网上现成的图像— — 相反,这些都是前所未有的效果图,其巧妙和独创性足以让艺术家们赞叹。 实际上,就连DALL-E的创造者们也经常不能理解其生成原理。

让我们看看DALL-E的一些作品。 首先是“ 满碗拉面表情符号” 下一张照片是“ 由牛油果组成的企鹅” 。 如果这些成果来自人类设计师,我们一定会把它看成是真正的创作物。 那么,有理由否定或拒绝DALL-E吗?

▲戴尔- e根据“ 满碗拉面表情符号” 输出的图像

▲戴尔- e根据“ 由牛油果组成的企鹅” 生成的图像

凭借这强大的创造力,DALL-E足以在产品设计、时尚、建筑等领域证明AI技术的现实意义。 不久,人类设计师可能会习惯使用DALL-E等AI系统作为创意助手和灵感的来源。

例如,要求设计“ 甜甜圈风的扶手椅” 时,DALL-E带来了各种构图选择。 当然,其设计和外观还很高。 可以预见,未来一定会有家具设计师反复使用DALL-E搜索模型输出,调整输入文本进行设计迭代,最终将AI元素导入到自己的作品中。 从车到照明,从宝石到房子,同样的创意过程适用于很多产品。

▲戴尔- e根据“ 甜甜圈风的扶手椅” 生成的输出图像

当然,DALL-E还不完美。 此外,生成的图像并不总是准确地表示输入文本。 例如,经常在颜色、数量、空之间的关系上犯错误。

OpenAI公开的DALL-E工作示例由CLIP神经网络进行排序和过滤。 对于每个文本输入,过滤后的系统只显示512个样本中最可靠的前32个样本。 换言之,DALL-E实际生成的图像很多,但其中大部分没有效果。

如上所述,DALL-E的创造力惊人,这项技术本身也在迅速重复。

和AI技术的其他重大发展一样,DALL-E再次回忆起旧问题。 机器的智能水平越来越接近人类了吗?

另一方面,DALL-E的诞生引起了关于超级智能技术的夸张表达。 但另一方面,以著名深度学习评论家Gary Marcus为代表的怀疑论者认为,DALL-E没有给AI技术的发展带来切实的推动。

Marcus的见解值得认真对待。 包括为DALL-E、GPT-3提供基础的最先进的转换器体系结构在内的深入学习,在智能概念建模方面仍然存在严重的限制。

但是,从某种意义上说,这场争论实际上偏离了真正的重点。 无论OpenAI的新模型是否代表着进入&ldquo,人工智能” 下一步,无论深度学习是否真的能带来与人类具有同等认知水平的机器智能成果,DALL-E本身仍然拥有非凡的新能力— — 这已经成为了不争的事实。

我们希望,DALL-E及其后续计划将为人与机器之间的创造关系带来新的可能性,从而创造巨大的经济价值,为新的创新初创企业和产品奠定基础。

面对无限的可能性,我们只是充满了期待。

【编辑推荐】

人力资源和社会保障部计划发布16名新的专业人工智能培训师,以入围 新华社1月2日电(李金磊)经人力资源和社会保障部同意,中国就业培训技术指导中心近日发布了《关于发布新岗位信息公开的通知》,包括在线合同分销商、人工智能培训师、全媒体运营商、医疗保

你真的知道人工智能和机器学习的区别吗?本文转自雷锋网,必要时转载到雷锋网官网申请授权。 你真的知道人工智能和机器学习的区别吗? 最近发表了一份报告,声称在产品和服务中使用人工智能[29] [30]的企业滥用人工智能。 根据Ver

用手机监视司机:司机记录器也开始应用AI技术本文从公众号rdquo; (ID:AI_Discovery)。 用手机监视司机:司机记录器也开始应用AI技术 过去三年来,美国成千上万辆货车配备了机器学习算法来分析驾驶员的行为。 算法可以检测驾驶员在车里拿到手

90后科技馆和他的另类搜索引擎Magi 最近,一个名为Magi的搜索引擎成为人们关注的焦点。据说这个搜索引擎与我们常见的搜索引擎非常不同,有一种被程序员喜爱的酷X风格。所以我们打开东方三博士,看了看。事实上,这一页看起

研究表明,生物识别可穿戴设备可以预测新型冠状病毒发作False

免责声明:非本网注明“禁止转载”的信息,皆为程序自动获取互联网,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责;如此页面有侵犯到您的权益,请给站长发送邮件,并提供相关证明,站长将在收到邮件24小时内删除。

热门标签

洛阳新闻网 | 新闻 | 关注 | 房产 | 汽车 | 教育 | 健康 | 婚庆 | 家居 | 旅游