<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="en">
	<id>https://wiki.hydite.com/index.php?action=history&amp;feed=atom&amp;title=AI_%E4%BC%A6%E7%90%86%E4%B8%8E%E5%AE%89%E5%85%A8</id>
	<title>AI 伦理与安全 - Revision history</title>
	<link rel="self" type="application/atom+xml" href="https://wiki.hydite.com/index.php?action=history&amp;feed=atom&amp;title=AI_%E4%BC%A6%E7%90%86%E4%B8%8E%E5%AE%89%E5%85%A8"/>
	<link rel="alternate" type="text/html" href="https://wiki.hydite.com/index.php?title=AI_%E4%BC%A6%E7%90%86%E4%B8%8E%E5%AE%89%E5%85%A8&amp;action=history"/>
	<updated>2026-06-03T22:09:03Z</updated>
	<subtitle>Revision history for this page on the wiki</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://wiki.hydite.com/index.php?title=AI_%E4%BC%A6%E7%90%86%E4%B8%8E%E5%AE%89%E5%85%A8&amp;diff=3&amp;oldid=prev</id>
		<title>WikiAdmin: Created page with &quot;&#039;&#039;&#039;人工智能伦理与安全&#039;&#039;&#039;（英语：&#039;&#039;&#039;AI Ethics and Safety&#039;&#039;&#039;）是研究人工智能系统在设计、开发、部署与使用过程中所涉及的道德规范、社会影响与风险防控的交叉学科领域。它既关注 AI 技术对个人权利、社会公平与人类价值的影响（伦理维度），也关注如何确保 AI 系统的行为可控、可靠且符合人类意图（安全维度）。随着大语言模型与自主智能体能力的快速提...&quot;</title>
		<link rel="alternate" type="text/html" href="https://wiki.hydite.com/index.php?title=AI_%E4%BC%A6%E7%90%86%E4%B8%8E%E5%AE%89%E5%85%A8&amp;diff=3&amp;oldid=prev"/>
		<updated>2026-06-03T19:25:07Z</updated>

		<summary type="html">&lt;p&gt;Created page with &amp;quot;&amp;#039;&amp;#039;&amp;#039;人工智能伦理与安全&amp;#039;&amp;#039;&amp;#039;（英语：&amp;#039;&amp;#039;&amp;#039;AI Ethics and Safety&amp;#039;&amp;#039;&amp;#039;）是研究人工智能系统在设计、开发、部署与使用过程中所涉及的道德规范、社会影响与风险防控的交叉学科领域。它既关注 AI 技术对个人权利、社会公平与人类价值的影响（伦理维度），也关注如何确保 AI 系统的行为可控、可靠且符合人类意图（安全维度）。随着大语言模型与自主智能体能力的快速提...&amp;quot;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;New page&lt;/b&gt;&lt;/p&gt;&lt;div&gt;&amp;#039;&amp;#039;&amp;#039;人工智能伦理与安全&amp;#039;&amp;#039;&amp;#039;（英语：&amp;#039;&amp;#039;&amp;#039;AI Ethics and Safety&amp;#039;&amp;#039;&amp;#039;）是研究人工智能系统在设计、开发、部署与使用过程中所涉及的道德规范、社会影响与风险防控的交叉学科领域。它既关注 AI 技术对个人权利、社会公平与人类价值的影响（伦理维度），也关注如何确保 AI 系统的行为可控、可靠且符合人类意图（安全维度）。随着大语言模型与自主智能体能力的快速提升，这一领域已成为人工智能研究与治理的核心议题之一。&lt;br /&gt;
&lt;br /&gt;
== 概述 ==&lt;br /&gt;
&lt;br /&gt;
人工智能伦理与安全通常被视为两个紧密关联但侧重点不同的方向。&amp;#039;&amp;#039;&amp;#039;AI 伦理&amp;#039;&amp;#039;&amp;#039;侧重于价值层面的问题，探讨技术应当遵循何种道德原则、如何避免对社会造成伤害；&amp;#039;&amp;#039;&amp;#039;AI 安全&amp;#039;&amp;#039;&amp;#039;侧重于技术层面的问题，研究如何在工程上保证系统行为符合预期、不产生意外或灾难性后果。二者在实践中往往相互交织——一个不安全的系统几乎必然带来伦理风险，而一个忽视伦理的系统也难以被认为是真正安全的。&lt;br /&gt;
&lt;br /&gt;
== 核心伦理议题 ==&lt;br /&gt;
&lt;br /&gt;
=== 公平性与偏见 ===&lt;br /&gt;
机器学习模型从历史数据中学习，可能继承甚至放大数据中潜藏的社会偏见，导致在性别、种族、年龄等维度上产生歧视性结果。如何在 [[机器学习]] 流程中检测、量化并缓解算法偏见，是公平性研究的核心。&lt;br /&gt;
&lt;br /&gt;
=== 透明性与可解释性 ===&lt;br /&gt;
许多现代 AI 系统（尤其是 [[深度学习]] 模型）具有&amp;quot;黑箱&amp;quot;特性，其决策过程难以被人类理解。可解释 AI（XAI）致力于提升模型的透明度，使决策依据可被审查与追溯，这在医疗、司法、金融等高风险场景中尤为重要。&lt;br /&gt;
&lt;br /&gt;
=== 隐私保护 ===&lt;br /&gt;
AI 系统的训练与运行往往依赖大量个人数据，由此带来数据采集、使用与共享中的隐私风险。差分隐私、联邦学习等技术被用于在不泄露原始数据的前提下完成模型训练。&lt;br /&gt;
&lt;br /&gt;
=== 责任与问责 ===&lt;br /&gt;
当 AI 系统造成损害时，责任应由开发者、部署者还是使用者承担，是伦理与法律共同关注的难题。明确的问责机制是建立社会信任的基础。&lt;br /&gt;
&lt;br /&gt;
== 核心安全议题 ==&lt;br /&gt;
&lt;br /&gt;
=== 对齐问题 ===&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;对齐&amp;#039;&amp;#039;&amp;#039;（Alignment）指确保 AI 系统的目标与行为符合人类真实意图与价值观。随着模型能力增强，如何避免系统追求被错误指定的目标（即&amp;quot;目标错误规范&amp;quot;）成为关键挑战。相关研究包括基于人类反馈的强化学习（RLHF）、宪法式 AI 等方法。&lt;br /&gt;
&lt;br /&gt;
=== 鲁棒性与可靠性 ===&lt;br /&gt;
AI 系统应在面对噪声、分布外输入或恶意攻击（如对抗样本）时保持稳定与可靠的表现。鲁棒性研究关注系统在非理想环境下的行为边界。&lt;br /&gt;
&lt;br /&gt;
=== 可控性 ===&lt;br /&gt;
随着自主智能体（Agent）能力的提升，如何确保人类始终能够监督、干预乃至中止 AI 系统的运行，成为安全研究的重点，涉及可中断性、人类监督等机制设计。&lt;br /&gt;
&lt;br /&gt;
=== 滥用风险 ===&lt;br /&gt;
强大的 AI 能力可能被用于生成虚假信息、网络攻击、自动化欺诈等恶意用途。防范技术滥用需要技术防护与制度约束的协同。&lt;br /&gt;
&lt;br /&gt;
== 治理与监管 ==&lt;br /&gt;
&lt;br /&gt;
各国与国际组织正逐步建立 AI 治理框架，试图在鼓励创新与防控风险之间取得平衡。常见手段包括风险分级监管、算法审计、透明度要求以及对高风险应用的合规审查。行业自律、技术标准与法律法规共同构成了 AI 治理的多层次体系。&lt;br /&gt;
&lt;br /&gt;
== 相关条目 ==&lt;br /&gt;
&lt;br /&gt;
* [[机器学习]]&lt;br /&gt;
* [[深度学习]]&lt;br /&gt;
* [[自然语言处理]]&lt;br /&gt;
* [[大语言模型]]&lt;br /&gt;
* [[计算机视觉]]&lt;br /&gt;
&lt;br /&gt;
== 参考与延伸阅读 ==&lt;br /&gt;
&lt;br /&gt;
* 关于对齐问题的综述性研究&lt;br /&gt;
* 各国 AI 治理与监管政策文件&lt;br /&gt;
* 可解释 AI（XAI）相关技术文献&lt;br /&gt;
&lt;br /&gt;
[[分类:人工智能]]&lt;br /&gt;
[[分类:AI 伦理]]&lt;br /&gt;
[[分类:AI 安全]]&lt;/div&gt;</summary>
		<author><name>WikiAdmin</name></author>
	</entry>
</feed>