我们正在进入新的互联网世界,没有回头路……
用人工智能生成的图像
在不到两个月的时间里,人工智能生成图像已经从技术的迭代中变成了我手机上的应用程序。
似乎正在发生一些非同寻常的事情,其规模和速度仅与1993年最后几周万维网的突然到来相媲美。
在那之前,很少有人听说过超文本。在那一刻之后,每个人都使用它,世界上大多数数据都在其中找到了一席之地。对于从未生活在前网络世界的人来说,很难阐明那个世界(一个你为了使用而访问的稀缺信息资源的世界)和这个世界之间的区别。
我们远远处于过渡的另一边,我们只是理所当然地认为我们的智能手机可以获得接近整个人类知识库、与所有人的联系等的东西。尽管这很壮观,但我们几乎从未想过它。这种魔法只是我们生活结构的一部分。
当你看到这里时,相信你有看过关于DALL-E的文章,这是新一代“生成人工智能”工具中的第一个。DALL-E将一些文本——在行词中是“提示”——变成图像。虽然我相信DALL-E完全令人惊叹,但它“在云端”的东西有可能成为艺术家和视觉创意者的新工具。
但是,后来发现我错了。
用人工智能生成的图像
回想起来,我们可能会看到这是人工智能领域的“大爆炸”时刻,当时整个领域在使用和无处不在方面都迈出了巨大的飞跃。
2022年8月22日,一家名为Stable AI的初创公司公开发布了自己的生成人工智能工具——“稳定扩散”。它在功能上与DALL-E(以及DALL-E的商业竞争对手Midjourney)相似,但这几乎就是相似之处。与其在云服务上运行的东西——你每月为此支付高额订阅费或按使用付费费用——Stable Diffusion旨在在PC上完全自给自足地运行。请记住,这不是一台特别低端的PC——而是一台你可能会在青少年的卧室里找到的,它支持高分辨率视频游戏。
尽管如此,这样的机器还是相当常见的:一夜之间,能够生成人工智能图像的计算机数量从少数增加到数千万台。
这本身意义重大,但稳定人工智能通过将所有工作发布为开源,加快了生成人工智能的时代——任何人都可以根据自己的需求获取代码并对其进行修改。一种被锁在Open AI墙后面的技术——像龙守护宝石一样囤积——立即成为数百个,然后数千个“创新”项目的基础,这些项目使用稳定人工智能提供的代码和数据来为自己的生成人工智能应用程序提供动力。
回想起来,我们可能会看到这是人工智能领域的“大爆炸”时刻,当时整个领域在使用和无处不在方面都迈出了巨大的飞跃。在快速连续的过程中,Meta宣布它已创建一个从文本提示生成视频的工具,Canva和微软都预览了生成AI工具在其设计工具套件中的集成,谷歌研究人员展示了“dreamfusion”这个工具,该工具使用与DALL-E和Stable Diffusion相同的技术从提示创建三维对象。
用人工智能生成的图像
我们现在充斥着生成人工智能创建的图像,使人工智能专家能够制作创意人员使用的工具的代码是免费的。
顶点事件发生在11月初,当时iPhone和iPad应用程序的开发人员推出了自己的应用程序,在苹果的智能手机和平板电脑上实现了稳定扩散。在不到两个月的时间里,生成人工智能已经从技术的创新变成了我iPhone上的应用程序。
在稳定扩散上使用人工智能提示生成:“迈向生成人工智能未来”。(图)
”网络上现在充斥着生成人工智能创建的图像,使人工智能专家能够制作创意人员使用的工具的代码是免费的。我们今天所处的位置只是第一次品尝到某种东西,这些东西准备融入一个全新的、独特的图像环境——无论是静止的还是移动的图像——通过巧妙的提示安排按需生成和品尝。
这一刻类似于29年前的那一刻,当时网络处于类似的门槛。它已经可用,已经开源,有几个人一直在对即将到来的转型迎来自己的“高光”时刻。了解我们今天对网络的了解,以及它非常错误的了解,我们最好地思考是如何最好地指导我们对生成人工智能的行动(和期望),寻找一条以最小的痛苦产生最大利益的途径。
在这一点上,在生成人工智能中已经确定了两个重要的痛点,每个痛点都与早期网络面临的类似问题相呼应:安全和版权。
安全问题归结为人性的基本事实——我们并不都是好人,甚至我们这些善良的人也并不总是像我们所能的那样好。鉴于将仇hen言论、xing暴力或其他形式的有辱人格的行为转化为视觉形式的强大技术,监督使用生成人工智能创建此类图像并防止此类图像的广泛传播似乎是明智的。
无论多么必要,这说起来容易做起来难。除了许可所有生成人工智能——并对其输出进行“水印”,以便将任何图像追溯到特定的生成人工智能及其用户,目前还不清楚如何对其进行有意义的监管。
社交媒体服务已经淹没在剥削、虐待、仇hen和暴li的人类生成材料中。通过生成人工智能添加自动化只会造成一场物质海啸,可以有效地压倒任何人类节制的尝试。我们需要从根本上重新思考温和的过程,在这波由生成人工智能放大的人类丑陋浪潮与我们的社交网络发生碰撞之前,我们可能需要在六到十二个月内迅速制定某种解决方案。
用人工智能生成的图像
自动化带来的规模仍然是这场生成性人工智能革命最重要的方面。
自印刷机发明以来,版权问题一直存在争议。网络将这些问题提升到一个全新的水平,因为它为版权材料的“解放”(更常见的是征用)创造了一个平台。稳定扩散,经过大规模囤积从公共互联网收集的100多兆字节的图像,并编码为仅为几千兆字节的“检查点”文件,将过去一万年的人类图像减少到一组“重量”。
在这个令人难以置信的人类视觉历史压缩渲染中,几乎每个作品都在网上拍摄和出版的艺术家的目录。这不仅仅是米开朗基罗、北斋或莫奈——检查站包括许多今天工作的优秀和商业艺术家,这些艺术家完全期望为他们的工作获得报酬。
稳定扩散模型可以“以”工作艺术家的风格产生图像,这是生成人工智能的胜利,同时也是令人深感担忧的发展。不是因为它是错误的,而是因为模型不承认其来源中的任何版权,因此无法从它生成的图像中过滤它们。
用人工智能生成的图像
这里的解决方案既显而易见又相对容易实施:稳定人工智能可以生成更新的“检查点”模型,以避免在世艺术家的作品——或作品仍然受版权保护的艺术家——除非他们明确许可。然后,一个“消毒”的检查点文件将是维基百科等公共资源的生成AI版本——向所有人开放,对所有人免费,并由丰富的人类图像提供支持。
相反,艺术家可以主动授权他们的作品被纳入生成的人工智能工具中。总部位于墨尔本的艺术家Anthony Breslin正是这样做的,他指出了生成的人工智能未来,它不仅仅是提取的,而是与艺术家合作,帮助他们创造工具,以前所未有的方式扩展他们的创意输出。
自动化带来的规模仍然是这场生成性人工智能革命最重要的方面。在未来几年内,我们看到的大多数图像都将通过生成人工智能工具。就其本身而言,这与几乎所有商业图像都以某种方式进行Photoshop化的事实没有什么不同。
但这些生成的人工智能图像不会是一次性的,发送到网站、杂志或广告牌。它们将无处不在,即用,由所有已经让我们不断监控的分析系统提供:根据我们的需求、情绪和愿望调整自己。这就是我们正在进入的世界,没有回头路。
即便如此,我们也有足够的时间来思考事情。
本网原创,未经许可,不得转载。【注:凡注明“来源:XXX(非西部融媒 www.xiburongmei.com)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责;如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。邮箱:651292478@qq.com】
阅读:0
必看
21 / 08月
24 / 01月
07 / 10月
01 / 10月
08 / 11月
16 / 11月
03 / 12月
12 / 06月
29 / 11月
19 / 07月
04 / 01月
23 / 11月
头条
标签
热榜