如果像现在这样的许多人一样,您试图对AI是什么以及它如何工作有更深刻的了解,但是由于您在术语上如此不透明而苦苦挣扎,以至于在进入马尔可夫之前就迷失了方向,因此秘密地有些恐慌。连锁店,您可能想要打开Janelle Shane的新书。她最近与VentureBeat坐下来谈论这本书,其书名“ You Look Like a Thing and I Love You”实际上是由AI生成的拾取线。
Shane维护着AI Weirdness博客,并结合了其博士学位的知识。电气工程学,对AI的迷恋以及倾向于一点点呆滞的荒谬幽默来解释AI的一种有趣且易于理解的方式。更重要的是,她使用幽默作为框架来展示AI在我们希望它可以做的大多数事情中实际上是多么危险。她的观点与人们对AI,它隐约可见的情感以及它对乌托邦或反乌托邦的能力常常过于幻想的观念背道而驰。
尽管本书向读者介绍了什么是AI,并解释了AI是如何“思考”的,以及我们应该如何思考AI的思想,但本书充满了傻笑的手绘插图和无尽的漫画示例。Shane的标志性举动是使用神经网络生成诸如新的冰淇淋口味,编织图案和食谱之类的东西。结果通常很有趣且离奇,并且几乎是存在的,例如Lemon-Oreo冰淇淋或Cluckerfluffer三明治(鸡肉,奶酪和棉花糖)。这是显示AI如何经常从悬崖上掉入怪异山谷的最不令人毛骨悚然的方法。
如果您可以不笑而超过基本蛤lam霜的配方(第18页),则可能是您出了点问题。
VentureBeat:当我第一次碰到[这本书]时,似乎很有教育意义。而且也很方便。我认为这听起来很棒。我知道这一切都始于AI Weirdness。您为什么开始创建该博客?这是怎么来的?
珍妮尔·沙恩(Janelle Shane):我看到另一个叫汤姆·布鲁尔的人他曾经使用这些生成文本的神经网络之一来制作食谱。在这种情况下,我笑得如此厉害,眼泪从我的脸上流下。我现在已经阅读了他生成的所有食谱-现在需要更多食谱!而且[我认为]我需要学习如何生成它们。这有点像-我觉得这很有趣。我产生了这种感觉,“好吧,现在我必须向人们展示。” 我认为是我的一些朋友会读它。我有博士学位的博客。大部分时间都有电子显微镜照片的日子。因此,我只是在这里进行了一些实验,[想],您知道,“这是一个博客,我将把这些东西放在那里。” 然后,是的,令我惊讶的是,其他人开始阅读它,例如,我什至不认识的人。
VentureBeat:本书从什么时候开始出现在博客上的?
Shane :在某种程度上,这是因为我开始与对这本书感兴趣的代理商和发行商交谈。但是,您知道,另一个动机也是,再次引起人们的困惑,因为我博客上的AI犯了各种各样的错误,并且“ AI难道不是聪明的吗?” 因此,本书是一种解释这些事情如何一次成为现实以及在人工智能环境下“智能”的含义的方式。这绝对不是什么意思。
VentureBeat:所以他们没有开玩笑吗?(这也很有趣。)
Shane :这更像是让他们感到困惑,就像他们明白了,“好吧,人工智能正在犯错误,哈哈,这很有趣,但是-为什么这那么糟糕?而且,这是另一种AI吗?” 这些东西-我推荐电影或给照片和东西贴标签。
VentureBeat:您是怎么看插图的?这是您的事,还是出版商来做?
Shane :这些都是我自己的插图。
VentureBeat:您是如何提出这种“语言”的,这是一种非常有趣且具有教育意义的艺术语言。那是怎么来的?
Shane :这就是我用自己的声音向自己解释事情的方式。我记得在进行TED会议时,我实际上是在进行排练时听到的,当时我听到了一些教练的话,彼此说:“不,她的确听起来像那样!” 是的,这不是一种行为!实际上,这就是我谈论这些事情的方式,也是我喜欢为自己写下这些东西的方式,使它们有意义。我告诉自己这个故事可以使我的思想井然有序。
毫无疑问,这种方法着重于示例,尤其是这些令人难忘的事情,这就是在您阅读完本书之后所要坚持的。就像我关于AI怪异的原则要牢牢记住一样,这与关于AI是否使我们是否应该识别鱼类以及人类是否握住手指的故事感到困惑的故事一样多奖杯鱼是鱼的一部分。或者,您知道,被告知要对数字列表进行排序并删除该列表的AI,从而消除了所有排序错误,从而在技术上获得了满分。
因此,将重点放在这些非常奇怪的,非常非人类的事情上……我认为部分原因是我遇到了机器学习的第一种方式,这是2002年在大学一年级时坐在一台机器上的。一个正在研究进化算法的家伙的演讲。他叫埃里克·古德曼(Erik Goodman)教授,他当时正在解释自己的研究,并讲类似的故事。我记得那真的吸引了我,是如此古怪,令人难忘且有意义,但也很难想象,就像某种方式研究自然世界一样。因此,这确实是我被机器学习所吸引的方式。
VentureBeat:让我惊讶的是,您解释神经网络的工作方式非常类似于Amelia Bedelia。[ Amelia Bedelia是一本儿童读物,将人们的字面意思全部接受,从而使幽默暴露于诸如成语之类的事物中。]这几乎就像Amelia Bedelia如何玩语言的数学版本。
Shane :是的,您知道,这是神经网络有趣的事情之一,因为它们没有要解决的确切问题的上下文。他们完全从字面上看待事情,因为这就是我们所知道的全部方法。然后您会遇到一些非常奇怪的情况,这种奇怪的幽默是由此产生的。是的,它肯定会按下某些相同的按钮。
VentureBeat:您使用现实世界中的示例以及荒诞的幽默来说明AI出现问题时会发生什么。对输出进行审查很容易,因为它看起来像胡言乱语,对吗?我们可以说该食谱没有道理,制作起来很有趣,并且指出了这一点,但是我想知道更少的异想天开的例子。因为,您知道,有很多研究人员和从业人员都在做同样的事情。我想我担心的是:我可以说这个输出很愚蠢,但是可以吗?他们如何能够像采用搞笑食谱时一样,对自己的结果进行审核?
Shane :是的,关于这类实验的事情正是这种情况,这促使我解释了AI。当您拥有这些荒唐的,真实的示例时…发放贷款的统计数据或深入了解简历的统计信息并不深入,但是…却弄乱了我们大家都能看到的东西。这是查看存在哪些限制以及如何一遍又一遍地弹出这些相同限制的一种非常有用的方法。
他们正在犯同样的错误,问题是,他们是否仔细地看着他们以发现这些错误?
VentureBeat:是否有成熟的解决方案供人们审核该输出,还是需要解决的大问题?
Shane :我能说的唯一一般规则是,永远不要相信神经网络。永远不要相信它来知道您的要求。永远不要相信不要采取快速捷径。然后有多种方法可以挖掘并找出它是否正确解决了这个问题。具体取决于您要解决的问题。
因此,在图像识别中,有一些非常不错的解释工具,其中[神经网络]突出显示了用于做出决策的图像部分,[您可以]说:“哦,不,它应该在看狗,而是查看草木背景”或类似的内容。
有那些工具。有些人认为很难建立可解释性,在某些情况下,您的主要工具可能正在对您的输出运行统计数据,并说:“好的,我们不知道它是如何对这些贷款申请做出决定的。我们不知道它适用什么规则,但是我们至少可以运行一大堆测试应用程序。把它们扔给它。看看决策的方式是否有趋势,因此我们知道如果事情没有偏见,应该如何做出决定。”
我知道现在有一些服务在系统地进行测试,以查看一个人的算法是否有偏差或有其他结果。我知道有很多公司根本不这样做。您知道,我希望看到有更多的自上而下的要求,这些要求通过某种标准化流程来审查这些算法-至少证明它们没有问题。否则,它们不会像他们可能遇到的那样麻烦。
VentureBeat:这与您在上几章中讲到的内容有些相似,尤其是当您对人造AI产生了冲击时:这些[AI]公司有时会说:“我们可以做到,相信我们, ”然后事实证明他们无法做到这一点,然后他们不得不惊慌失措,要么因为失败而归还所有启动资金,要么进入那里并搞砸了,然后手工修复。这说明了它的“黑匣子”。
我是从记者的角度出发的,我不是专家。因此,当有人告诉我们他们的事情有效时,我们必须获得一定程度的信任……这很棘手。因此,我想知道,就您而言,您认为该问题在市场中的普及程度如何?
Shane :实际上,我认为它非常普遍。有些领域可能比其他领域更容易出现此类问题。我会非常仔细地观察自动排序简历的任何人。我们已经看到了一些案例研究,例如来自亚马逊的一个案例研究,他们自愿提供了一个他们决定不使用的工具,因为很难停止歧视。
这有点像一种罕见的情况,我们可以看到……工程团队的挣扎,试图摆脱这种倾向于复制培训偏见的倾向。对于每个告诉我们的亚马逊,“哇,我们有一个问题,我们决定通过根本不使用这种解决方案的方式来缓解它,”在这种情况下,我们有很多公司在做相同的应用程序,以及基本上相同的方法,而且他们还没有发布任何数字来说明他们具有什么样的偏见或为减少偏见所做的具体工作。因此,是的,那里有很多毫无根据的主张-您说:“哦,是的,使用我们的计算机算法,我们将照顾您的人力资源团队的招聘偏见”,而没有任何证据表明使用AI确实会有所帮助。
VentureBeat:很快就出现了一种趋势,[AI产品和服务的制造商]就像,“哦,不,肯定有人在。” 不管是口头服务还是他们真的相信它,他们都会说:“是的,看,我们必须具有人性化的感觉”,而他们却不会说:“我们不能相信我们的模型。” 考虑到这一点,您是否认为有时候公司只是在不真正解决核心问题的情况下转向该消息传递?
Shane :肯定有很多AI应用需要人工管理作为一种质量控制。肯定在我正在做的所有AI生成的幽默中,例如…大部分都不有趣。你需要一个人。我永远不会训练文本生成算法,然后像把它交给孩子们一起玩一样。很难消毒!当人们与我谈论进行此类项目时,我总是说:“您不希望这件事与公众交谈。” 因为这会说出可怕的话,并且您需要介于两者之间的人员层来阻止这种情况的发生。
而且,您知道,在很多情况下,尤其是在某些创造性应用程序中-这些是我最了解的应用程序-我当然知道,这可以节省时间,但是您仍然需要一个人。语言翻译是同一种事物;人工翻译现在使用机器翻译作为第一稿。它已经很接近了,但是如果不进行一些人工质量清理,它肯定还没有准备好。
但是,我们遇到了另一种情况,那就是让人员参与其中,以防止算法受到偏见。这很有意思;回过头来,[构建算法的人员]有偏见,算法有偏见,并且需要人员。对此,我只想说:“好吧,您知道……向我展示数据。”
我们可以通过这个东西来运行测试数据。拥有一个算法而无需人工执行这些决定的美。我们可以给它10,000笔贷款或10,000份简历或10,000个社交媒体资料,看看是否有任何趋势。而且,如果有人没有这样做,我担心他们对自己的算法是否存在潜在有害方式的缺陷并不认真。
VentureBeat:自从您写完这本书以来,您认为该领域发生了什么变化(例如在研究,影响,部署等方面)?(我知道那是2019年,这是最近的)。
Shane :哦,伙计,情况变化如此之快。我被鼓励看到的一件事是对某些不良申请的更多推后行动,越来越多的社区和人民加紧反对,政府也试图介入,尤其是欧洲议会试图介入和干预。做正确的事。
因此,令我感到鼓舞的是,我们希望能脱离蛇油领域。…现在有更多的应用程序需要担心,例如面部识别。…不好,但是运行得更好,所以有很多方面需要担心,而在我的书中,担心甚至没有用。好吧……现在可以了,这也是一个问题。
VentureBeat:由神经网络生成的最喜欢的五个随机事物是什么?
Shane :天哪。[ 暂停 ]我真的很喜欢这样的实验:人们从起点开始就使用神经网络,然后直接运行。我做了一个实验-AInktober-在十月期间生成绘图框。人们画了最神奇的东西。
曾经有一种叫做SkyKnit的软件,它在其中产生编织图案,人们不得不尝试调试所有错误并将它们变成事实,这只是光荣的。
然后,Hat 3000进行钩编也做了同样的事情。事实证明,使用钩编帽子是一种不经意间的不良举动,往往会造成吞噬宇宙的双曲线纱线怪兽。
我曾经做过一个例子,当时我正在生产饼干,而人们实际上是根据插图制作食谱的,例如香料大块,胡瓜和杏梦dream鼠。
该油漆的颜色一直再回来。使用绘画颜色使我有机会在演示屏幕上以大写字母打印“ TURDLY”一词。