分类
Research

设计支持社区福祉的人工智能系统框架

引言:设计用于支持健康和福祉的人工智能(AI)是技术专家、设计师和政策制定者面临的一个重要且广泛的挑战。本文基于人工智能和控制论理论,提出了一个用于优化人类福祉的智能系统设计框架。我们专注于在复杂的社区环境中产生福祉信息反馈循环,并讨论了“我的健康检查”(My Wellness Check)案例研究,这是一个在新冠疫情期间为支持大学生和教职工的心理健康和福祉需求而设计的智能系统。

方法:我们的讨论基础是“我的健康检查”这一社区主导设计的智能系统,它在新冠疫情期间支持了大学生和教职工的心理健康和福祉需求。我们的系统旨在创建一个智能反馈循环,以评估社区福祉需求并指导社区行动。本文概述了我们在新冠疫情期间对大学生和教职工福祉(n = 20,311)的两年纵向评估。

结果:我们进一步分享了一项对照实验(n = 1,719)的结果,证明了我们的基于情境的福祉评估的增强敏感性和用户体验。

讨论:我们设计“面向社区福祉的人工智能”的方法,可能适用于大规模治理(例如学校、企业、非政府组织、平台)中其他人类-计算机系统中人类福祉的系统性改进。两个主要贡献是:1)展示了一种简单的方法,从人工智能理论中汲取灵感,以创造更智能的人类系统;2)引入了一种以人为本、社区主导的方法,这可能对人工智能领域有益。

引言

随着人工智能(AI)的持续发展,研究人员越来越多地探索其在支持和增强心理健康和福祉方面的潜力。凭借其分析大量数据和做出复杂决策的能力,AI有可能为寻求改善心理健康和福祉的个人和社区提供宝贵的见解和支持(D’Alfonso, 2020)。在本文中,我们并没有将“面向福祉的人工智能”视为心理健康领域的专门兴趣,而是认为所有符合伦理的人工智能系统都应有提升人类福祉的隐含目标。这与电气和电子工程师协会关于伦理设计的标准审查一致:“通过将[人工智能]的创造与用户和社会的价值观对齐,我们可以将提升人类福祉作为算法时代进步的指标”(Shahriari 和 Shahriari, 2017)。

尽管“面向福祉的人工智能”通常指的是使用人工智能工具(如聊天机器人)来支持心理健康和福祉,但本文关注的是利用人工智能研究者开发的理论,以更好地理解如何设计大规模系统以增强和支持福祉结果。

例如,欧盟委员会将人工智能系统定义为“通过分析其环境并采取行动——以一定程度的自主性——来实现特定目标的系统”(2019, p. 1)。

更具体地说,一本流行的人工智能教科书将人工智能领域定义为“智能代理的研究和设计”,其中代理可以被视为通过传感器感知其环境并通过执行器对环境采取行动的任何事物(Russell 和 Norvig, 2022)。为了让这样的代理被认为是智能的,它必须具备“选择一个预期能最大化性能指标的行动的能力……被分配了明确‘目标函数’的代理,如果它始终采取成功最大化其编程目标函数的行动,则被认为更智能”(Russell 和 Norvig, 2022, p. 58)。基于这些标准,人工智能系统必须具备感知环境、对环境采取行动、在环境中测量明确的目标状态(即性能指标或目标函数),并使用感知数据选择可能改善该性能指标的行动——请参阅基于这些理论主张的建议框架,见框1。简而言之,这一理论表明,未来的面向福祉的人工智能系统可能不可避免地需要评估人类福祉的机制。

框1:基于Russell和Norvig(2022)中关于“选择一个预期能最大化性能指标的行动”的能力定义的人工智能系统设计框架。

本文展示了通过社区主导设计开发基于情境的福祉评估,这可能为未来人工智能系统通过社区主导设计评估福祉提供启示。也就是说,我们介绍了“我的健康检查”案例研究:一个用于优化和支持大学生和教职工在新冠疫情期间的需求的智能系统。该系统与学生、教职工和心理健康专业人士合作设计,提供了一个能够评估社区福祉需求并指导社区行动的治理反馈循环。基于理论推导的福祉因素以及社区参与者定义的因素,“我的健康检查”产生了社区福祉的实时洞察,这些洞察被用于指导从大学高层管理人员到个别学生的各个层面的行动。我们分享了“我的健康检查”在新冠疫情期间近30,000名学生和教职工中的两年纵向部署的数据。为了评估我们的系统,我们分享了一项对照实验的结果,比较了我们的社区主导福祉评估与其他福祉评估。这表明我们的社区主导设计产生了更大的预测价值和显著更好的用户体验。尽管我们的结果不能作为我们整个系统性能的效能证明,但它确实展示了我们社区主导设计过程的好处。

学校、企业、非政府组织、社交平台和其他大规模治理系统可能希望系统地改善他们服务对象的福祉。我们的工作旨在提供可以推广到这些不同情境的见解。与其设计一个完全自主的系统(例如,一个为学生提供心理健康建议的聊天机器人),我们专注于向现有的社会技术系统引入一个智能反馈循环。

论文概述

在本文的第一部分,我们概述了“设计面向福祉的人工智能”的概念,并回顾了一些相关的工作。然后,我们讨论了人本设计领域中流行的一些方法和想法,如参与式设计、社区主导设计、系统思维和控制论思维,以应对设计面向福祉的人工智能的一些挑战。

在论文的第二部分,我们描述了“我的健康检查”的具体情境和设计。然后,我们展示了在疫情期间多次福祉评估的数据。在对系统设计的描述之后,我们介绍了评估我们基于情境的评估的对照实验的设计和实施。在介绍该实验结果之后,我们反思了我们的设计框架,并建议了未来在设计面向社区福祉的人工智能系统方面的研究机会。

相关工作:设计面向福祉的人工智能

关于使用人工智能进行福祉或心理健康的研究虽然数量不多,但正在增长,其中大部分集中在使用人工智能进行健康监测和个性化健康建议。这些服务通常通过虚拟代理、聊天机器人、可穿戴设备和其他物联网技术提供(见Shah和Chircu的综述,2018)。根据D’Alfonso(2020),人工智能在心理健康中的三个主要应用是:(1)个人感知或数字表型;(2)临床文本和社会媒体内容的自然语言处理;(3)聊天机器人。另一项综述发现人工智能在心理健康中的机会主要与自我跟踪和人工智能辅助数据分析有关(Graham等人,2019)。

2020年关于福祉的交互式系统(DIS)研讨会提供了该领域的以下总结:“大多数关于探索和支持心理福祉的人机交互(HCI)工作涉及移动设备、传感器和各种在线系统,这些系统专注于跟踪用户”(Sas等人,2020)。这反映了以用户为中心的福祉解决方案的重点,其中福祉被视为个人的关切。

在本文中,我们提出了一个替代的设计目标:支持一个社区人群的福祉。社区的福祉可以被理解为一个多维度的价值集合,包括经济、社会和环境价值,这些价值影响社区中的人(见Shah和Chircu的综述,2018)。这种方法的一个优势是,它不需要对个人进行长期跟踪,这在数据隐私和安全方面带来更多的风险。当个人跟踪揭示出福祉的不足时,可能会损害个人的自我形象,并产生内疚或失望的感觉(Chan等人,2018)。

2019年关于福祉的HCI技术的综述提出了以下观点:“我们主张研究人员有伦理责任设计更具创新性的心理健康技术,这些技术较少依赖于跟踪数据,而更多地依赖于对数据的理解、反思和可操作性,以促进积极的行为改变。”(Sanches等人,2019)。通过专注于社区层面的福祉(即大学校园的学生和教职工),我们可以避免数据跟踪问题,并包括多样化的利益相关者,他们可以帮助理解福祉数据、对其进行反思并制定积极行动的方法。

作为我们社区关注的一部分,我们的工作围绕系统的两个组成部分展开:对社区福祉需求的评估和针对这些需求设计的干预措施。我们受到控制论理论的启发,设计我们的系统以产生一个支持自上而下和自下而上过程的福祉反馈循环。这种方法适合我们的参与式和社区主导设计方法。它也与开发一个使用黑箱、算法方法干预社区的自主系统的目标形成对比。最后,我们采用了一种迭代的、纵向的设计方法,强调对福祉评估的改进以及将这些评估转化为行动的过程。

控制论:设计智能反馈循环的概念框架

由于人工智能和机器学习的日益流行,控制论重新引起了人们的兴趣(Pangaro, 2017, 2021),并且可以被视为其概念前身(图1)。部分解释这种兴趣的原因是关于人工智能的常见(误)观念,即人工智能的目的是用计算智能取代人类智能——也被称为“人工智能思维”(van der Maden等人,2022)。由于人工智能通常主要关注计算系统,控制论为理解能够表现出有目的(智能)行为的系统的设计提供了一个概念框架——无论这些系统是自然的、人工的还是两者的混合。

图1:控制论作为人工智能的概念前身的示意图,经Lomas J. D.等人(2021)许可使用。

控制论可以被描述为一门跨学科的研究领域,它关注设计用于实现目标的人类和机器治理系统,这些系统通过传感器和执行器来运作。控制论一词源自希腊语κῠβερνήτης(kubernḗtēs),意为“舵手”或“管理者”(注意“治理”一词也源于这个希腊词根)。控制论已被用于帮助设计从机器人到组织的各种系统。它还被用于研究人类认知和社会互动。

框2:福祉理论

福祉的概念化

根据世界卫生组织的定义,福祉是“一种完整的身体、心理和社会福祉状态,而不仅仅是没有疾病或虚弱”(世界卫生组织,1946)。换句话说,福祉不仅仅是身体健康,还包括心理健康、情绪健康以及感觉自己属于并得到社区支持。

学术文献中有许多方法来概念化和操作化福祉。一些常见的福祉维度包括身体健康、心理健康、情绪健康、社会健康和精神健康。尽管学者之间存在共识,但关于福祉概念的定义似乎缺乏强有力的共识(Dodge等人,2012)。学者们批评该领域,认为定义在很大程度上取决于研究者的文化背景和研究的应用领域(Alexandrova,2012)。考虑到这种概念上的分歧,Cooke等人(2016)对福祉文献进行了综述,确定了四个主要领域,这些领域将作为本文的框架。

享乐主义福祉模型关注快乐和幸福。这一领域由Ed Diener的主观福祉三元模型开创(Diener等人,1985,1999),该模型认为对生活的满意度、缺乏负面情绪以及存在正面情绪是福祉的重要组成部分。这种观点通常在评估福祉时考虑这三个构建,尽管许多研究者主要关注Diener的“生活满意度得分”(Cooke等人,2016;Linton等人,2016)。优绩主义福祉模型提供了试图超越满足生活快乐的研究。例如,Ryff的六因素心理福祉模型关注自我接纳、与他人的积极关系、自主性、环境掌控、生活目标和个人成长(Ryff和Keyes,1995;Ryff和Singer,2006)。此外,Martin Seligman的福祉理论涵盖了这两种观点(享乐主义和优绩主义),认为福祉(或繁荣)可以用积极情绪、投入、意义、积极关系和成就(PERMA)来概念化(Seligman,2011)。第三类福祉研究关注生活质量(QoL)。Cooke等人(2016)指出,尽管这一术语通常与福祉互换使用,但应被视为一个单独的类别,因为生活质量的研究通常将福祉概念化为包括身体、心理和社会功能的模型。它通常与生命末期或残疾生活中的福祉相关。一个常见的评估工具是由Frisch等人(1992)开发的生活质量清单。最后,Cooke等人(2016)描述了第四类称为健康。他们指出,健康方法通常基于咨询,倾向于更广泛且不太明确,也不一定与评估工具相关。相反,健康从业者关注一种全面的生活方式,可以包括许多健康和功能领域,包括精神健康。

社区福祉

福祉通常被理解为围绕个体体验展开。然而,一个人的福祉也依赖于“一系列相互关联的问题和约束,并嵌入动态的社会背景中”(Phillips和Wong,2017)。沿着这一思路,Musikanski等人认为社区福祉应被定义为涵盖社区、文化、经济生活水平(包括住房、食品、交通以及信息和通信技术)、教育、环境、政府、健康、心理福祉、主观福祉和情感、时间平衡以及工作等领域(2020,第41页)。与这种分类一致,社区福祉已被操作化为涵盖类似的类别(vander Weele,2019;vander Weele等人,2020)。

一个控制论系统是一个使用反馈循环来控制系统行为的系统。在其最简单的形式中,控制论系统仅由三个部分组成:控制器、传感器和执行器或执行机构。例如,在一个简单的家用恒温器中,传感器是温度传感器,执行器是打开加热器的开关,控制器是一种机制,将传感器与用户设定的点进行比较。如果传感器值低于设定点,控制器就会打开加热器,见图2。如果传感器值高于设定点,控制器就会关闭加热器。更复杂的“智能恒温器”可能有额外的传感器(例如湿度、占用情况等)和执行器(例如空调、风扇等),控制器可能使用更复杂的算法来决定何时打开和关闭设备。

图2:左侧的示意图(1)是典型控制论系统的抽象(改编自Dubberly和Pangaro,2007)。右侧的示意图(2)显示了一个典型的控制论系统——恒温器的例子。

然而,控制论系统并不局限于像恒温器这样的简单设备。控制论系统可以在生物体(例如控制血糖水平的反馈循环)、社会系统(例如调节人与人之间互动的反馈循环)以及人工智能系统(例如允许机器人从错误中学习的反馈循环)中找到。

控制论与人工智能领域密切相关。这两个领域都关注自适应系统的设计。一个典型例子是强化学习,这是一种机器学习方法,它使用奖励或惩罚来训练代理感知和解释其环境并采取行动,见图3。这两个领域也存在典型的不同之处。例如,控制论更倾向于关注理解或设计允许系统控制其行为的反馈机制,而人工智能更关注设计允许系统从其环境中学习或适应的算法。其次,控制论更倾向于设计自然系统(即设计人类治理系统),而人工智能更关注设计计算系统。

图3:典型强化学习算法的示意图(改编自Sutton和Barto,2018)。

从实践角度来看,控制论为设计包含计算机和人类的治理智能系统提供了一种观点(例如Krippendorff,2007,2021;Glanville,2009;Sweeting,2016;Dubberly和Pangaro,2019)。通常由于人类互动的特殊能力,用计算自动化取代人类智能往往是不可取的。相反,需要设计自然系统和计算系统,使它们协同工作以产生更智能的行为(即在不确定的环境中更能够实现目标)。控制论提供了一种概念化手段,将人类和人工系统结合起来。尽管“保持人类在循环中”是许多人工智能研究人员的关键设计目标,但人们通常认为,如果人类智能仍然参与系统,那么人工智能就尚未完成。因此,控制论可能为设计复杂人类系统中的人工智能提供了一种观点,在这种情况下,人们并不希望用计算自动化取代人类智能。这在新冠疫情期间支持大学管理者支持其社区福祉需求的背景下显得尤为合适。

设计一个如此广泛利用人类信息处理和行动的人工智能系统可能会面临挑战。为了概念化如何在一个更大的人类系统背景下设计人工智能系统,我们借鉴了系统思维(例如Arnold和Wade,2015)和控制论方法(例如Wiener,1961;von Foerster,2003;Krippendorff,2007)。这些观点指出,人工系统可以被设计为利用社区中已经运作的人类系统,而不是试图自主完成所有工作。控制论方法通过关注一个核心过程来简化算法设计问题:在福祉评估和增强福祉的行动之间产生反馈循环。此外,控制论方法使我们不必将所有过程自动化为计算过程;我们可以在一个复杂的社会技术系统中设计智能,而不必制造一个完全自主的人工智能代理。此外,我们将展示,这样的系统可以迅速实施,并且随着时间的推移,可以通过迭代设计、社区反馈和适当的自动化进行改进。

总结来说,基于人工智能和控制论理论,我们试图创建一个能够促进社区福祉的智能反馈循环。下面的图4可视化了我们情境中涉及反馈循环的不同组成部分。接下来将讨论设计感知系统状态的能力,之后将描述定义行动空间和处理器的过程(我们已经解释过,这是控制论反馈循环所必需的)。

案例研究:“我的健康检查”,新冠疫情期间的福祉

新冠大流行对全球社会造成了重大冲击,对心理健康和福祉产生了深远的影响。特别是,新冠大流行似乎显著降低了全球范围内的人类福祉水平(Brodeur等人,2021)。大流行还引发了对大型组织在支持福祉方面作用的兴趣,将其作为组织成功的明确标准。例如,大学的目标是实现各种组织成功指标(例如,高毕业率、大量申请者、可持续性指标等)。越来越多的大学开始将学生和教职工的福祉视为明确的机构优先事项(Burns等人,2020;Lomas D.等人,2021)。

在2020年初新冠大流行开始时,大学管理层询问我们如何最好地支持因政府限制而被困在家中的教职工和学生。这导致了一个为期两年的迭代式、社区主导的系统设计过程,以帮助支持心理健康和福祉。在本节中,我们将讨论可能适用于其他情境的部分过程。其普遍性在于从我们的控制论过程中产生的部分——例如,基于情境的评估——在概念上具有可转移性,而不是事实上的可转移性。

系统的核心需求是能够感知社区中的福祉需求。这一“感知器”将是未来任何面向社区福祉的人工智能系统或控制论系统的核心。因此,我们的主要目标是设计一个对特定情境敏感的福祉评估工具,并且能够为响应性的行动提供信息和动力。

福祉的理论方法:为了开发我们的感知器,我们并没有选择某一特定的人类福祉理论(见框2),而是采取了一种折衷的方法,从多个理论传统中汲取灵感(例如Diener等人,1999;Ryff和Singer,2006;Seligman,2011)。这是合理的,因为我们的评估目标与传统心理学方法中测量人类福祉的典型目标不同(见框3),后者旨在创建一个准确且理论上有效的测量工具。相反,我们的目标是创建一个可操作的评估:一个旨在帮助为社区中的具体行动提供信息并激发促进福祉的行动的评估。

框3:福祉评估

福祉的测量:在最近对99种成人自我报告福祉评估的综述中(Linton等人,2016),作者指出,这些评估工具基于不同的基础理论,种类繁多。在他们的综述中,他们认为最具影响力的两种理论是Diener等人(1985,1999)的主观福祉理论和Ryff和Keyes(1995)的心理福祉理论。他们得出结论,根据情境的需要,不同的工具可能各有适用性。这一观点在另一项对42种工具的最新综述中也得到了呼应(Cooke等人,2016)。

尽管学术界尚未达成共识,但麦肯锡最近关于欧洲福祉的报告指出:“关于如何最好地测量福祉,正在形成一种共识。研究人员现在倾向于问一个基本问题:‘总体而言,你对目前的生活有多满意?’”(Allas等人,2020)。这一问题基于Diener的生活满意度量表,因其简短且便于在不同人群之间以及不同时期进行比较而受到青睐。然而,这一量表并不能具体说明问题所在或可能的解决办法。

特定领域的福祉:尽管生活满意度得分是进行比较的绝佳手段,但福祉评估的目的可能是为支持改善福祉的有用行动提供信息。例如,员工满意度评估通常旨在提高员工满意度。因此,福祉评估最好能够对特定领域的需求敏感。例如,在小学环境中,校园欺凌可能对学生的福祉产生重大影响;在公司环境中,工作与生活的平衡可能对员工福祉产生重大影响。在这两种情况下,特定领域的评估可以更有助于为改善特定情境中的福祉采取行动。

当在特定领域(如工作或学校)进行福祉评估时,我们将其称为特定领域的福祉评估(例如Renshaw等人,2014;Renshaw和Bolognino,2014;Gregory等人,2019)。例如,大学生主观福祉量表(CSSWQ)旨在评估大学生相关的多种组成部分,研究者将其称为“共活力”(Renshaw等人,2014)。不同的组成部分包括对学业的满意度、学业韧性、学校归属感、学业自我效能感以及对大学的感激之情。

新冠与学生福祉:新冠大流行和封锁措施对全球范围内的主观福祉产生了显著影响(例如Aucejo等人,2020;White和Van Der Boor,2020;De Pue等人,2021;Hu等人,2021;Khan等人,2021)。常见的研究主题包括焦虑、孤独、心理压力和创伤后应激障碍(Xiong等人,2020)。这些影响在大学生中可能更为显著,因为许多学生通常独自居住在狭小的住房中,远离家人,并且面临经济不稳定。除此之外,尽管存在诸多限制因素(例如网络连接、缺乏工作、家庭挑战),学生仍被期望像往常一样完成学业目标(Crawford,2020)。根据文献,学生出现了动机下降(Tan,2020)、绝望感(Pretorius,2021)和抑郁(Fawaz和Samaha,2021)。对此,一些出版物建议改变心态:例如,坚韧和感恩(Bono等人,2020)或乐观(Genç和Arslan,2021)被提出作为改善福祉和应对大流行的方法。然而,这些建议并没有直接表明社区或组织如何响应以改善学生福祉。

框4:基于情境的评估、可操作性和评估体验

基于情境的评估:社会性颠覆性事件(如大流行)会引发人类价值观及其在社会中的优先级的变化(Daher等人,2017;Klenk和Duijf,2021)。由于新冠大流行期间的隔离和封锁,似乎有许多以前不被认为是福祉关键因素的事项。例如,家庭工作环境的体验——如“Wi-Fi质量”或“专用工作台”等因素——通常不被福祉评估工具所考虑。然而,在新冠大流行的背景下,这些因素变得与社区成员的福祉体验相关。识别影响福祉的各种机制是设计研究的一个普遍挑战(Fokkinga等人,2020)。因此,我们需要一种能够识别重要新因素的方法——识别我们是否在向正确的人提出正确的问题。这种方法应有助于识别当前正在积极影响福祉的因素,以便指出可以设计干预措施的地方。

可操作性:现成的福祉评估工具,主要出现在心理学文献中(如前一节所述),通常是为有效性和可靠性而非可操作性而构建的。我们所说的可操作性是指一个测量工具用于告知有益行动的有用性。例如,生活满意度量表(SWLS;Pavot和Diener,2009)已被证明是一种强大的跨文化测量个人福祉的工具,但它并不是为了指示如何在特定情境中改善福祉而设计的。例如,假设你是一名管理者,希望改善你所在组织成员的福祉,知道你所在社区的平均成员的SWLS得分为21,以及PANAS得分为26,并不能立即告诉你应该在哪里采取行动来改善这些得分。这些得分必须与情境因素相关联,才有意义。另一方面,在大学领域,大学生主观福祉问卷(CSSWQ;Renshaw和Bolognino,2014)可能比一般性测量工具(如SWLS)更具可操作性,因为其问题的颗粒度更细。然而,尽管有这种颗粒度,这些问题仍然没有直接指向采取行动的机会。当前的福祉评估工具可能具有可靠性和有效性,但这些工具提供的信息可能并不足够具体,以至于社区可以用来采取行动以支持改善福祉。请注意,提供更具可操作性信息的并不是具体的条目,而是评估工具作为一个整体,将“现成的”测量工具与情境化条目结合起来。因此,我们称之为基于情境的福祉评估——而不是测量工具。

评估体验:评估体验之所以重要,有两个基本原因。首先,积极的体验可以提高参与者的参与度和数据质量(Stocké和Langfeldt,2004;Baumgartner等人,2021)。其次,评估福祉的体验本身可能是一种干预措施。也就是说,回顾自己生活的不同方面有可能导致建设性的变化和福祉改善的体验。尽管在本研究中没有定量评估这一改善福祉评估体验的理由,但它是我们设计“我的健康检查”的主要动机之一。

流行的福祉评估工具通常侧重于概括性。也就是说,它们试图验证一种可以在多种情境中进行比较的测量工具。Diener的单一项生活满意度测量是一个很好的例子:在0到10的量表上,你对你的整体生活有多满意?这种测量工具(及其许多变体)对于比较不同情境中的福祉非常有用。这种测量工具是“可操作的”,因为低分表明需要采取一些行动。然而,将低分归因于具体原因是困难的——这使得采取具体行动变得困难。因此,我们试图设计新的福祉测量工具,这些工具高度针对我们希望服务的社区的情境。我们预计,基于情境的评估将更具可操作性(因为它涉及具体问题),并且更能满足社区的需求。

因此,我们使用福祉的因子化模型作为组织原则,以帮助识别可以支持社区行动的具体和具体问题。图5显示了各种理论福祉因素可能在我们的情境中如何表现。例如,许多不同的人类福祉模型都认识到物质福祉是福祉的一个重要因素(例如Sirgy,2018)。然而,物质福祉的含义可能因情境而异。在新冠大流行期间的福祉情境中,例如,我们询问了家庭工作空间的符合人体工程学的质量——这可以被视为一个因果指标(Wong和Law,1999)——作为评估家庭工作环境对福祉影响的一部分。根据Mackenzie等人(2011)的说法,正是这些因果指标属于调查工具。

图5:调查体验的外观示例。第一个屏幕显示了关于生活满意度的评分项,第二个是关于身体福祉的复选框项,第三个显示了关于他们额外福祉需求的自由文本项。

在所有迭代中,“我的健康检查”评估考虑了社区福祉的一系列多样化指标:学术体验、焦虑、自主性、行为、归属感、能力、应对策略、新冠措施、抑郁、药物和酒精、锻炼、预期的大学支持、财务状况、家庭工作环境、生活满意度、孤独感、情绪、动机、营养、乐观主义、整体身体健康、个人成长、目标感、远程教育、睡眠、学习表现和主观情绪。此外,在构建评估项目时,我们还参考了多种调查工具,包括“沃里克-爱丁堡心理健康量表(WEMWBS)”(Tennant等人,2007)、“PERMA量表”(Butler和Kern,2016)、“生活满意度量表(SWLS-5)”(Diener等人,1985;Pavot和Diener,2009)、“生活和谐量表(HILS-3)”(Kjell和Diener,2020)、“世界卫生组织生活质量量表(WHO-5)”(Topp等人,2015)、“心理福祉量表(PWB)”(Ryff和Keyes,1995;Ryff和Singer,2006)、“威斯康星纵向研究(WLS)”(Piliavin和Siegl,2007)、“美国中年研究(MIDUS)”(Radler和Ryff,2010)、“美国家庭和家庭调查(NSFH II)”(Springer和Hauser,2006)、“大学生主观福祉问卷(CSSWQ)”(Renshaw和Bolognino,2014)以及“学生WPQ”(Williams等人,2017)。

社区主导的调查设计:我们对社区福祉评估的设计结合了传统的心理学调查开发方法(Boateng等人,2018)以及多种以人为本的设计方法,特别是社区主导的设计方法(Costanza-Chock,2020)。我们所说的社区主导设计,具体是指我们让社区成员和社区领导者参与评估工具的非正式设计和非正式评估(见Lomas和van der Maden,2021)。与其采用严格的系统方法(这是心理学调查开发的典型方式),我们鼓励各个层面的大学领导对要问的问题类型“发表意见”(通常是针对一个具体的示例)。通过与社区领导者的合作,我们能够增强他们对评估实施的投入感和热情。此外,还有三个概念对工具的开发至关重要:基于情境的评估、可操作性和评估体验——见框4。

为了平衡社区领导者的需要与广大社区的需要,我们还在调查的多次迭代中投入了大量精力来收集不同视角。起初,我们通过与大约15名学生和7名教职工进行非正式的半结构化访谈,收集了关于当前需求以及对学术体验和整体社区福祉的看法。这些访谈侧重于识别与不同理论福祉因素相关的具体指标。这些社区访谈与大学领导层的优先事项一起,帮助确定了我们最初调查问题集的重点。在开发出初步的调查体验后,我们邀请了大约40名多样化的学生通过视频聊天完成整个调查。在提供知情同意并承诺匿名的前提下,我们鼓励参与者对个别调查项目发表评论并提出批判性反馈。由于隐私原因,所有内容数据都被丢弃。然而,这种观察方法有助于提高问题的相关性,减少问题含义的模糊性,并确保没有遗漏重要主题。在大约4周的开发过程中,对调查进行了许多细微的迭代,以确保适当的节奏和顺序。

这种迭代设计和调查开发甚至在后续的调查部署中仍在继续,相关内容将在下一部分讨论。图5展示了一个移动用户界面的示例,这显示了为创造一个激励性和积极的调查体验所做的努力。它还展示了定量数据收集程序与在自由文本框中收集受访者声音的紧密整合。

在初步部署调查后,关于各个项目的统计数据使我们能够识别出哪些项目能够很好地预测我们的核心测量指标——生活满意度,以及哪些项目不能。此外,在调查之后,所有受访者都有机会留下关于改进调查的批判性反馈。这种对社区主导迭代的强烈关注被假设为可以创造更好的调查体验,并产生对社区福祉更敏感的“传感器”。正如后面将要讨论的那样,这些假设通过一项对照实验进行了测试。

部署社区福祉评估:本节概述了我们在新冠疫情期间对社区福祉评估的部署,涉及27,270名学生和6,347名教职工(最后一次迭代的总大学人口,2021年11月)。为学生和教职工分别设计了不同的调查。参与者人数以及每次迭代的总结可以在表1中找到。

表1:在代尔夫特理工大学进行的福祉评估的不同迭代的概述。

所有学生和教职工都收到了一封用荷兰语和英语写成的电子邮件,邀请他们参与研究。邮件中包含了指向在线调查的链接,该调查可以在平板电脑、手机或台式机上完成。评估的欢迎文本向参与者提供了关于其数据匿名性的信息(将在讨论中提及保证匿名性的限制)、该评估符合GDPR标准的事实,从而为他们提供了足够的信息以做出知情同意。所有数据都进行了匿名化处理。

随时间的定量结果:由于篇幅原因,我们重点关注学生结果的纵向数据。表2根据评分类型问题(即要求在0到10的量表上进行评分)展示了学生福祉数据随时间的变化。表3分享了列出学生同意特定陈述(复选框项目)的百分比的数据。

表2:在代尔夫特理工大学通过评分项目收集的学生福祉数据的概述。

表3:显示学生同意以复选框形式呈现的陈述的比例。

定性结果:除了统计测量外,我们还设计了调查以收集代表学生和教职工“声音”的书面文本。开放式问题是评估社区需求以及收集大学可能采取的改善福祉的具体行动想法的重要工具。这些问题包括:“什么有助于你在代尔夫特理工大学的归属感和社区感?”“你缺少哪些方面?”以及“你有什么想法可以帮助代尔夫特理工大学支持学生动机吗?”

开放式问题有助于引出学生需求的具体陈述,并作为组织改进的具体想法的来源。定量数据有助于显示不同大学人群中的模式(例如,可以看到国际学生与本地学生在身体健康问题上的程度)。书面回应通常是组织改进的具体想法的来源。例如:“我真的很想念与同学之间的咖啡闲聊和陪伴。我想见到人们”;“我真的很希望混合式学习能够继续,这样我就可以在我的祖国完成我的硕士学位”;“组织无声迪斯科舞会,在地上画圆圈,这样你就可以在自己的空间里跳舞!”;“我很高兴能回到校园,设施很棒。然而,很难找到一个安静的地方进行视频通话。”以及“由于[COVID-19],有些人彼此非常熟悉,而有些人则不然。很难加入一个小组,特别是如果你根本不认识任何人。大学可以帮助为国际学生组织见面小组。”

为社区行动设计:前一节专注于为社区福祉设计一个“传感器”。这个传感器的目的不仅仅是生成一个测量值,而是要作为一个控制论反馈循环的一部分,以激发后续的社区行动——这些行动有助于改善社区福祉。

因此,在设计社区行动时需要完成两个核心任务:1)确定可能改善社区福祉的行动;2)激励社区行动者采取适当的行动。在实践中,我们努力将这两者结合起来:当社区行动者参与一个帮助他们识别改善福祉的有用行动的过程时,这成为他们后续行动的关键动力。

在每次调查迭代之后,我们与大约20到40名多样化的在线参与者举行了社区主导的设计研讨会。研讨会参与者包括学生会选举的学生代表、员工顾问(包括心理学家和参与心理健康辅导的员工)、院长、高层管理人员、副校长以及来自大学各个层面的其他学生和教职工。在每次研讨会之前,每位参与者都会收到几百条书面回应进行审阅,并被指示识别独特的需求及其帮助的想法。在研讨会上,小组讨论并综合这些需求和想法的清单。在关于不同想法的“可行性”和“紧迫性”的全体讨论之后,需求和想法的清单被汇总起来,以便向大学高层管理展示。目的是分析定性数据,以告知社区从调查中出现的福祉需求,并收集改进的想法。为了最大化行动的潜力,我们特别注意让行政决策者参与阅读和审阅调查回应。下面的表4突出了一些行动的想法以及可能采取行动的机构(即“控制论处理器”)和它们分别传达给社区的需求领域。

表4:许多行动的想法与潜在行动者(即“控制论处理器”)以及它们各自的需求领域,这些内容被传达回社区。

通过向各个利益相关者展示数据,也激励了社区行动。例如,在数据收集活动之后,向大学的执行董事会和教育委员会进行了数据展示。我们的分析结果可以直接与几项政策联系起来。例如,大学组织了一个“福祉周”,开展了与报告结果相关的各种活动(即支持睡眠、锻炼和社交)。更具体地说,由于我们发现家庭工作环境是福祉的一个强预测因子,大学资助了一个项目,提供符合人体工程学的椅子和办公桌。一个更微妙的例子来自许多学生表达他们欣赏更人性化的沟通方式——例如,院长以非常个人的方式发送电子邮件询问学生的情况。这一发现促使大学提供关于改变官方电子邮件语气的指导。除了行政变化之外,社区也从社区角度采取了行动。例如,许多在新冠疫情期间开始攻读博士学位的学生表示他们错过了结识他人和进行“偶然社交互动”的机会。这激发了一个名为“博士生速配”的项目,博士生们被随机分配到Zoom上与他人聊天,以扩展他们的社交网络。

除了自上而下的政策外,数据还被用来激励自下而上的社区响应。我们设计了信息图表(见图6),与大学中的教育工作者、教职工和学生分享结果。这些材料不仅包含了定量调查数据,还包含了学生的“声音”。教育工作者被邀请在设计课程、讲座和与学生的互动时考虑这些结果。一位教育工作者回应说:“当某件事情引起我的共鸣,我产生共鸣时,我就会感到采取行动并在实践中实施改进的紧迫性。”

图6:该图展示了与大学内所有教育工作者分享的信息图表的一部分,概述了定量数据,尤其是定性数据。该信息图表在大学范围内的通讯中分享,并附有对研究的简短总结以及这条信息,即该信息图表可以帮助教育工作者在创造支持福祉的教育环境中获得灵感。

在允许对抗新冠的措施的情况下,社区研讨会也以面对面的方式组织。一群研究人员和设计师参与了一个受“世界咖啡馆”格式启发的研讨会,该格式基于这样的信念:如果组织内的人们被置于一个开放的对话和交流环境中,他们甚至可以找到解决复杂问题的方法(Löhr等人,2020)。

我们还促进并设计了让学生成为行动主体并对自己产生影响的倡议。所有对“哪些日常例程对你有效?”这一问题的回答都被收集并分析。这产生了一系列视觉材料,这些材料由学生协会每周在其社交媒体账户上分享一次,见图7。这四集涵盖了从调查回应分析中出现的重要学生主题,并由第一人称句子组成,描述了对福祉有益的日常例程。其目标是用对他们的同龄人有效的例程来激励学生,因此更有可能对他们也有效。其他自下而上的成果包括学生主导的福祉项目。例如,一名学生创建了一个推荐系统,帮助学生在预算内优化他们的居住环境,并向数千名学生推广了这一系统。

图7:该图展示了与当地学生协会合作推出的“这对我有效!”福祉活动的选图。其目标是收集学生在调查中使用的促进福祉的例程或仪式,并与他们的同龄人分享。

实验评估:对整个系统的定量评估仍然是一个挑战——例如,涉及多个社区的对照实验在很大程度上是不可行的。因此,我们试图定量评估系统的部分。在接下来的部分中,我们分享了一项对照实验的结果,该实验比较了我们的福祉评估与其他使用标准心理学方法开发的福祉评估(Boateng等人,2018)。由于我们的社区主导设计方法积极地让社区中的多样化利益相关者参与其中,这可能导致测量效率降低。我们选择了沃里克-爱丁堡心理健康量表(WEMWBS)和大学生主观福祉问卷(CSSWQ),因为它们是广泛使用的福祉评估工具,并且适合我们的调查干预的背景。也就是说,我们不能期望学生完成完整的正负情感量表(PANAS)——以指出另一种广泛使用的评估工具。这将过于繁琐,并且与他们已经习惯了四次迭代(即MWC)的调查体验不同。

与现有的经过验证的评估工具相比,我们旨在测试以下两个假设。我们预测,我们的基于情境的福祉评估将实现:

  1. 对生活满意度(人类福祉的核心测量指标)的预测能力得到改善。
  2. 用户体验的测量得到改善。

通过将研究人群的样本随机分配到三个问卷中的一个,并在之后比较他们对体验的评价来测试这些假设。这项对照实验在学生调查的第四次迭代中进行,即2021年6月,见表5。

表5:在代尔夫特理工大学进行的福祉评估的不同迭代的概述。

程序:2,062名学生参与者被随机分配到不同版本的问卷:所有参与者的12.5%将收到WEMWBS,12.5%将收到CSSWQ,其余的人将收到我的健康检查(75%)。选择这些比例是因为我们在现实世界环境中进行了研究,这意味着调查的目标必须保持与最初的目标一致——收集有关学生和教职工在新冠疫情期间的福祉数据,以指导机构行动。WEMWBS和CSSWQ被选中是因为它们是经常使用且经过验证的全球和特定领域福祉的测量工具。

在开始实验问题之前,所有参与者都回答了一个关于他们生活满意度的共同问题。在回答完实验问题后,参与者被要求根据Stocké和Langfeldt(2004)以及Baumgartner等人(2021)的观点回答七个关于他们问卷体验的问题。

实验结果:表6显示,我们的基于情境的评估提高了评估的整体敏感性,并增强了参与者的调查体验。为了计算敏感性,我们使用回归模型来预测个体的生活满意度得分,使用来自三个调查的回答。我的健康检查(MWC)产生了比WEMWBS或CSSWQ更高的R²(预测拟合度的衡量)。将所有MWC项目纳入模型中,产生的R²为0.75,而仅限于复选框项目(非0-10量表问题)的模型仍然产生了0.53的R²,超过了包含WEMWBS中所有项目的模型(R²=0.51)和包含CSSWQ中所有项目的模型(R²=0.42)。然后,为了比较参与者对调查体验的评价,MANOVA显示,在表6中列出的所有项目中,我的健康检查(MWC)与WEMWBS和CSSWQ之间存在显著的正差异(p<0.0001)。唯一的例外是MWC显著更令人疲惫(p<0.0001),见表6。这表明,参加MWC调查的参与者发现该体验的价值显著更高,参与度更高,值得程度更高,且更有趣。所有统计测试均使用JMP 16进行。

表6:第四次迭代期间实验结果的概述。

讨论:本文的目的是展示一种设计用于改善社区福祉的系统的方法。基于设计人工智能系统的框架,我们强调了控制论理论在设计涉及复杂人类社区的智能系统时的价值,因为人工智能理论帮助我们理解反馈循环是复杂系统的一个关键特征,而将人类纳入反馈循环的设计中是创建智能系统的必要条件。

基于这一理论背景,我们分享了一个案例研究,我们在其中设计了一个智能反馈循环,以促进新冠疫情期间大学学生和教职工的福祉。我们的工作侧重于使用社区主导和以人为本的设计活动来产生福祉的“传感器”(基于情境的福祉评估)、福祉的“执行器”(我们社区中不同利益相关者可以采取的行动空间)以及福祉的“处理器”(使传感器数据能够转化为行动)。在我们的案例研究中,我们描述了在新冠疫情期间两年间社区福祉的纵向波动以及采取的相应行动范围。为了评估我们的努力,我们还分享了一项对照实验的结果,该结果表明,与现成的福祉评估工具相比,我们的福祉评估提高了对福祉的敏感性,并提供了更好的用户体验。我们的工作表明,社区主导和以人为本的设计方法可能有助于开发能够增强和支持福祉的系统。下面是一个我们框架的一般示意图。请注意,这些步骤适用于任何复杂系统,无论是主要人工的还是主要人工的。

我们讨论的其余部分分享了一个愿景,描述了我们的“面向福祉的人工智能”方法如何推广到其他复杂系统,包括在线社交媒体系统和国家政府。然后,我们讨论了这种方法的几个重要限制。最后,我们反思了“控制论思维”在设计旨在整合人类和机器智能的系统中的相对优势。

推广面向福祉的人工智能方法的愿景:本文中的案例研究特定于我们大学在新冠疫情期间的背景。这些方法和方法可能普遍适用于其他寻求优先考虑社区福祉的大学或组织。除此之外,我们的框架和方法显示出指导其他复杂社会技术系统中福祉反馈循环设计的希望。换句话说,我们的方法不一定是下一个“新冠22”的蓝图,而是一种理解系统如何应对影响全球社会的新型或紧急现象的方式。

例如,这里采用的方法可能为将人类福祉整合到当代社交媒体平台(如Facebook)的优化中提供见解。为了提供背景,Meta的首席执行官表示:“我们觉得有责任确保我们的服务不仅有趣,而且对人们的福祉有益”(2018)。这一声明引入了一个新的“福祉”指标,称为有意义的社会互动(MSI)。然而,三年后,“Facebook文件”(Zuckerberg,2018;Hagey和Horwitz,2021)表明,社交媒体服务中仍然有许多方面对用户福祉有害。我们的工作展示了一种系统设计方法和社区主导的设计方法,用于人类福祉反馈循环,这可能对社交媒体服务和其他社会技术系统的设计有用。例如,Facebook的MSI指标可以通过本文描述的社区主导设计方法和系统设计方法进行改进和扩展。

我们的工作也可能推广到一般的社会治理。在新冠疫情期间,欧洲的福祉降至40年来的最低水平(Allas等人,2020)。福祉通常不是经济增长和衰退讨论中明确重视的内容。然而,麦肯锡公司提出了一个福祉的货币价值模型,通过考虑一个人需要额外获得多少收入才能将其福祉提高到期望水平来进行评估。根据这一模型,麦肯锡估计新冠大流行期间的福祉损失是经济损失(即GDP下降)的三倍以上。

越来越多的国家政府正从单纯关注经济增长转向更综合的“福祉经济”焦点(Fioramonti等人,2022)。自不丹在2008年修改宪法将“国民幸福总值”作为核心目标以来,基于福祉的治理理念已成为一个重要的研究课题(Ura等人,2012)。经济合作与发展组织(OECD)推广并维护着一项全国范围内的幸福和福祉衡量指标,该指标被用于排名和政策制定(Mizobuchi,2014)。显然,将公民福祉作为衡量政府成功的一个更明确的标准的趋势正在形成。

在这里,我们希望传达一种以公民体验为核心的福祉治理的设计愿景。我们希望公民感受到政府甚至更小的组织在努力最大化人民的福祉是什么样的体验?毕竟,过度关注单一指标总是存在风险的(Rambur等人,2013;Stray,2020;Thomas和Uminsky,2020)。我们借助隐喻来传达我们的设计愿景(Hekkert和van Dijk,2011)。基于人工智能的人类福祉优化可能令人不安,仿佛我们把社会的管理权交给了机器。相反,我们对优化社会福祉的愿景更像是一种审议性的民主进程。也许政府可以将系统性的福祉评估作为一种参与性仪式(类似于投票日),以便更容易地“倾听人民的声音”。然后,我们设想集体审视公民的需求和愿望的过程更像是一种审议性的“市政厅”民主:一个混乱、耗时但极具社交性的过程,旨在弄清楚人们需要什么,以及可以采取什么行动来提供帮助。我们的案例研究表明,使用以人为本和社区主导的方法来优化组织中大到小的福祉是有可能的;上述设计愿景旨在传达如何以一种人文主义的方式将“面向福祉的人工智能”扩展到“面向福祉的治理”。

局限性:面向福祉的人工智能系统的目标是改善人类福祉。设计这样的系统,首先需要对人类福祉进行测量,还需要根据测量结果采取行动。在一个理想的世界里,对福祉评估做出反应的行动应该是(1)可观察的,(2)有理论依据的(即有一个已知的作用机制和一些可预测的效果),并且(3)经过实证评估的。然而,在新冠疫情期间的大学环境中,这些标准并未得到满足。很难确切知道社区成员根据评估数据采取了哪些行动。此外,很少有行动有一个清晰定义的理论模型来说明它们可能如何影响福祉。最后,没有采取的行动经过了统计评估。事实上,即使对某些行动进行了评估,也没有什么能表明它们在另一个时间点会有相同的效果。因此,很难评估我们整个系统的有效性。换句话说,我们无法确定所进行的人本活动是否是所有可能行动中最好的,也无法验证我们的方法是否是最优的。

尽管我们无法对福祉反馈循环的好处做出因果推断,但也许可以像观察一个原型控制论系统——恒温器一样,观察我们系统的运行。在恒温器中,加热器会一直工作,直到温度达到期望范围。在我们的案例中,一旦福祉恢复到被认为是“正常”的范围,系统目标就已达成,大学可以将资源转移到“正常业务”上。社区促进福祉的动机类似于这个比喻中的加热器。当福祉低于某个水平时,大学社区被激励采取各种行动。当福祉上升到可接受的水平以上时,专注于福祉的动机就会减弱。就像恒温器一样,当评估到的需求高时,我的健康检查会增强采取行动的动机,而当评估到的需求低时,就会减少动机。

在现实世界的大学环境中设计这个系统,不仅仅是创建技术、开发调查和执行以人为本的设计方法。它还需要我们作为研究人员和设计师进行混乱的、非正式的、不科学的政治参与。这种参与对于获得多个大学利益相关者的认可和参与至关重要。然而,通过实施这个系统所需的数十次会议,我们能够利用心理顾问、学生顾问、人力资源人员、学生会成员和行政领导等社区专业知识。这个过程远远超出了在技术系统中“保留人类在循环中”的范畴。这种局限性(或特点)将与在大型复杂社会环境中改善福祉的人工智能系统的设计有关:除了软件开发和用户界面设计之外,可能还需要混乱的、民主的政治进程。这为以人为本的设计师在大型复杂社会技术系统中的适当角色创造了新的机会和需求。

设计思维、人工智能思维和控制论思维:在本节中,基于我们的案例研究,我们讨论了在复杂人类系统中应用的人工智能系统设计的观点。在以人为本的设计领域,“设计思维”是一个用于创造性问题解决的过程,通常在设计行业中使用(Pressman,2019)。与此同时,“人工智能思维”可以被描述为一个用于计算问题解决的过程,通常在人工智能行业中使用;简单来说,“如果有问题,人工智能可能是解决方案”。然而,许多现实世界的问题远比人工智能算法能够处理的要复杂,特别是当人工智能被设想为一个完全自主的代理时。这些现实世界的问题可能包括与其他人的情感互动或协商价值观或伦理。因此,“人工智能思维”有可能产生负面结果,因为它将人工智能设计者的注意力集中在生产完全自主的系统上,用计算智能取代人类智能。对算法能力的狭隘关注可能导致设计出与现实世界系统中的人类能力不尊重或不利用的脱离实际的人工智能系统(Gillespie,2014;Krippendorff,2021;Pangaro,2021)。例如,“人工智能思维”产生了利用复杂数据提供医疗诊断或教育建议的产品。这些产品往往失败,因为人类医生可以理解地不信任“黑箱”诊断,就像教师倾向于不信任“黑箱”课程选择一样(London,2019;Wang等人,2020)。相反,当系统不是被设计为完全自主的,而是被设计为可以与现有工作流程以一种“不显眼”的方式结合的服务时,系统会更好地工作(Yang等人,2019)。

“以人为本的人工智能”提供了设计与人类协同工作的人工智能系统的机会,而不仅仅是取代他们。在可预见的未来,人类仍将更擅长理解人和回应他们的情感需求。复杂的伦理或价值驱动的决策将继续需要人类利益相关者进行协商。人工智能设计方法需要考虑人工智能系统的局限性,并设计能够与人类和现有组织协同工作的人工智能系统——支持人类的决策,而不是试图取代他们。如果人工智能系统要被人类使用,那么人工智能系统需要被设计为满足人类用户的需求。

然而,我们建议,从试图严格区分人工智能和人类智能中会出现一些重要的概念问题。许多人工过程、规则或算法存在于组织中,旨在产生智能结果。应该将人工设计的智能人类过程视为人工智能吗?如果人工智能被定义为“人工设计的智能过程”,那么这意味着人工智能并不需要计算算法。相反,算法可能只是被写下来并由人类执行。例如,“掌握学习”是一种教育方法,涉及一个简单的算法:如果学生在一个主题测试中表现出掌握,他们就可以继续下一个主题,否则他们需要继续学习并掌握手头的主题(Bloom,1973)。掌握学习可以得到计算机的支持,但它也可以作为一个非计算的控制论反馈循环来实现(例如,仅使用教师和纸质测试)。

人工智能可以被定义为任何一种人工设计的智能信息处理过程——无论该过程是否使用硅微处理器。这将扩大人工智能的范围,包括所有类型的治理系统,而不仅仅是依赖于先进计算机的系统。以自动驾驶仪为例,在自动驾驶汽车甚至现代飞机的背景下,自动驾驶仪当然被归类为一种人工智能。然而,第一架飞机的自动驾驶仪是一个机械系统,发明于1912年。如果我们把人工智能定义为“人工设计的智能过程”,那么这意味着存在大量不涉及计算机的人工智能。这可能对我们思考人工智能系统及其对社会的影响的方式产生深远的影响。

为了方便起见,有些人可能希望坚持一种流行的人工智能概念,这可以被描述为“一个自主的算法系统,使用先进的计算技术以排除人类智能的方式实现非平凡目标”。在这种情况下,不符合这一定义的人工智能设计的智能过程可能被称为“智能系统设计”,而不是“人工智能”。重要的是,即使非计算性的工作也可能对人工智能领域做出贡献,特别是当它展示了将人工智能理论和方法应用于智能系统的设计时。

与设计思维或人工智能思维相比,“控制论思维”描述了智能系统的设计,其中系统中的智能依赖于传感器/执行器反馈循环(van der Maden等人,2022)。通过关注信息反馈循环的设计,其中系统的表现被用来修改系统的行为,控制论思维可以应用于任何目标驱动的系统,无论是计算的还是非计算的。例如,控制论思维可以用于设计教育系统(如上文提到的掌握学习的描述)或员工绩效评估,其中员工绩效的指标被用来修改正在进行的绩效。控制论思维可能有价值,因为它关注整个系统的动态(包括人类和机器),而不是天真地关注流行的计算算法。在我们的案例中,我们发现控制论思维在设计促进社区福祉的反馈循环中是无价的。

结论

福祉不仅仅是个体的关切,也是社区和社会的关切。通过设计一个系统来评估和在新冠疫情期间支持社区福祉,我们展示了如何在大型复杂的社会系统中将福祉作为明确目标进行系统性优先考虑。我们的工作做出了以下关键贡献:

首先,基于人工智能和控制论理论,我们提出了一种在社区规模上支持人类福祉的反馈循环设计方法。这种方法对于拥有大量个体的社会技术系统具有重要意义。在我们的案例研究中,我们所在的大学规模庞大,拥有超过30,000名学生和教职工。

其次,我们为新冠疫情期间的特定情境提供了一个具体的案例研究。这个案例研究提供了我们方法的实际应用示例,例如通过社区主导设计在线调查,从我们大学社区收集有价值的福祉数据反馈。这些反馈随后以定性需求评估和总结统计的形式反馈给社区,直观地展示了福祉随时间和不同子群体(例如学术人员和非学术人员)的变化。

第三,我们提出了一种利用人类福祉数据指导社会技术系统设计的方法。我们利用福祉数据生成见解和建议,以改进我们大学对新冠疫情的应对措施。例如,我们为大学中的特定利益相关者提供行动建议。这是一个重要贡献,因为它为如何利用福祉数据改进社会技术系统提供了一个具体的示例。

最后,采用控制论框架并使用以人为本和社区主导的设计方法,我们开发了一种新颖的基于情境的福祉评估工具。为了评估我们的工具,我们进行了对照实验:与经过验证的其他福祉评估工具相比,我们发现我们的基于情境的福祉评估得到了参与者的更高评价,并且展示了更强的预测有效性。我们还提供了定性证据,表明我们的评估产生了更具“可操作性”的数据,以激励机构和社区采取行动。

在设计支持福祉的交互式系统时,我们的方法从关注个体用户需求转变为设计面向社区和机构的系统。我们还从设计静态产品转变为设计智能产品服务系统——一个旨在作为大型复杂社会技术系统中的控制论循环运行的系统。最后,我们的思维方式发生了转变,我们接受了我们并不是主导设计的专家,而是社区主导设计过程的促进者。这些转变可能很微妙,但它们代表着我们最初对应用人机交互、设计和人工智能方法来创建支持新冠疫情期间福祉的工具的看法的巨大飞跃。我们的观点是,任何未来关于将人工智能系统与福祉和民主等价值观对齐的工作都将从本文中介绍的类似过程中受益。