微信公众号
IT之家 12 月 8 日音讯,谷歌标明,其新的人工智能模型系列有一个独特的功用:可以“辨认”心情。
谷歌周四发布了其最新 AI 模型系列 PaliGemma 2,该模型具有图画剖析才能,可以生成图画描绘并答复有照顾片中人物的问题。谷歌在其博客中介绍,PaliGemma 2 不仅能辨认物体,还能生成具体且与上下文相关的图片说明,包括动作、情感及全体场景的叙说。
PaliGemma 2 的情感辨认功用并非开箱即用,有必要进行专门的微调,但专家们依然对此标明忧虑。
多年来,许多科技公司一直在测验开发可以辨认情感的 AI,尽管一些公司宣称现已获得打破,但这一技能的根底任旧存在争议。大多数情感辨认系统都根据心理学家 Paul Ekman 的理论,即人类有六种根本心情:愤恨、惊奇、讨厌、高兴、惊骇和哀痛。但是后续的研讨标明,来自不同文化背景的人们在表达情感时存在十分显着差异,这使得情感辨认的普遍性遭到质疑。
伦敦国王学院专门研讨人工智能的研讨员 Mike Cook 标明,情感辨认在正常的情况下是不可行的,由于人类的情感体会很杂乱。尽管人类能经过调查别人来揣度他们的心情,但不能做到全面且完美地处理心情检测问题。
情感辨认系统的另一个问题是其可靠性和成见。一些研讨标明,面部剖析模型或许会对某些表情(如浅笑)发生偏好,而最近的研讨则标明,情感剖析模型对黑人面孔的不活跃的心情判别比白人面孔更多。
谷歌标明,PaliGemma 2 在进行“广泛测验”后,评价了其在人群成见方面的体现,成果显现其“毒性和粗鄙内容的水平低于职业基准”。但该公司并未揭露测验所根据的完好基准,也没有清晰说所进行的测验类型。谷歌发表的仅有基准是 FairFace—— 一个包括数万张人像的面部数据集。谷歌宣称,PaliGemma 2 在该数据集上的体现杰出,但一些研讨者批判 FairFace 存在成见,以为该数据集仅代表少量几种族群。
AI Now 研讨所首席 AI 科学家 Heidy Khlaaf 标明,解读心情是一件适当片面的工作,它逾越了运用视觉辅助工具的规模,深深地嵌入在个人和文化背景中。
据IT之家了解,欧盟的《人工智能法案》制止校园和雇主布置情感辨认系统,但答应法律组织运用。
Khlaaf 标明,假如这种所谓的情感辨认是建立在伪科学假定的根底上的,那么这种才能或许会被用来进一步轻视边缘化集体,例如在法律、人力资源、边境管理等范畴。
谷歌发言人标明,公司对 PaliGemma 2 的“表征损害”测验充满信心,并进行了广泛的道德和安全评价。
微信公众号