<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="en">
	<id>https://wiki.hydite.com/index.php?action=history&amp;feed=atom&amp;title=%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89</id>
	<title>计算机视觉 - Revision history</title>
	<link rel="self" type="application/atom+xml" href="https://wiki.hydite.com/index.php?action=history&amp;feed=atom&amp;title=%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89"/>
	<link rel="alternate" type="text/html" href="https://wiki.hydite.com/index.php?title=%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89&amp;action=history"/>
	<updated>2026-06-03T22:09:04Z</updated>
	<subtitle>Revision history for this page on the wiki</subtitle>
	<generator>MediaWiki 1.45.3</generator>
	<entry>
		<id>https://wiki.hydite.com/index.php?title=%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89&amp;diff=4&amp;oldid=prev</id>
		<title>WikiAdmin: Created page with &quot;&#039;&#039;&#039;计算机视觉&#039;&#039;&#039;（英语：&#039;&#039;&#039;Computer Vision&#039;&#039;&#039;，缩写 &#039;&#039;&#039;CV&#039;&#039;&#039;）是人工智能的一个重要分支，研究如何使计算机从数字图像、视频或其他视觉输入中获取、处理、分析与理解信息，并据此做出决策或采取行动。其目标是让机器具备类似甚至超越人类视觉系统的感知与理解能力。作为 人工智能 与 深度学习 的核心应用领域之一，计算机视觉已广泛渗透到工业、...&quot;</title>
		<link rel="alternate" type="text/html" href="https://wiki.hydite.com/index.php?title=%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89&amp;diff=4&amp;oldid=prev"/>
		<updated>2026-06-03T19:26:27Z</updated>

		<summary type="html">&lt;p&gt;Created page with &amp;quot;&amp;#039;&amp;#039;&amp;#039;计算机视觉&amp;#039;&amp;#039;&amp;#039;（英语：&amp;#039;&amp;#039;&amp;#039;Computer Vision&amp;#039;&amp;#039;&amp;#039;，缩写 &amp;#039;&amp;#039;&amp;#039;CV&amp;#039;&amp;#039;&amp;#039;）是人工智能的一个重要分支，研究如何使计算机从数字图像、视频或其他视觉输入中获取、处理、分析与理解信息，并据此做出决策或采取行动。其目标是让机器具备类似甚至超越人类视觉系统的感知与理解能力。作为 &lt;a href=&quot;/index.php?title=%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD&amp;amp;action=edit&amp;amp;redlink=1&quot; class=&quot;new&quot; title=&quot;人工智能 (page does not exist)&quot;&gt;人工智能&lt;/a&gt; 与 &lt;a href=&quot;/index.php/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0&quot; title=&quot;深度学习&quot;&gt;深度学习&lt;/a&gt; 的核心应用领域之一，计算机视觉已广泛渗透到工业、...&amp;quot;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;New page&lt;/b&gt;&lt;/p&gt;&lt;div&gt;&amp;#039;&amp;#039;&amp;#039;计算机视觉&amp;#039;&amp;#039;&amp;#039;（英语：&amp;#039;&amp;#039;&amp;#039;Computer Vision&amp;#039;&amp;#039;&amp;#039;，缩写 &amp;#039;&amp;#039;&amp;#039;CV&amp;#039;&amp;#039;&amp;#039;）是人工智能的一个重要分支，研究如何使计算机从数字图像、视频或其他视觉输入中获取、处理、分析与理解信息，并据此做出决策或采取行动。其目标是让机器具备类似甚至超越人类视觉系统的感知与理解能力。作为 [[人工智能]] 与 [[深度学习]] 的核心应用领域之一，计算机视觉已广泛渗透到工业、医疗、交通、安防等众多场景。&lt;br /&gt;
&lt;br /&gt;
== 概述 ==&lt;br /&gt;
&lt;br /&gt;
人类视觉系统能够轻松完成识别物体、判断距离、理解场景等任务，但让计算机实现这些能力却极具挑战。计算机视觉的核心问题在于：图像本质上只是像素值的数值矩阵，如何从这些低层次的数值中提取出高层次的语义信息（如&amp;quot;这是一只猫&amp;quot;或&amp;quot;前方有行人&amp;quot;），是该领域长期研究的根本难题。&lt;br /&gt;
&lt;br /&gt;
早期的计算机视觉主要依赖人工设计的特征（如边缘、角点、纹理）与传统机器学习方法。自 2012 年 [[深度学习]] 在图像识别任务上取得突破以来，基于卷积神经网络（CNN）的方法逐渐成为主流，并在近年进一步扩展到 Transformer 等新型架构。&lt;br /&gt;
&lt;br /&gt;
== 核心任务 ==&lt;br /&gt;
&lt;br /&gt;
=== 图像分类 ===&lt;br /&gt;
判断一张图像整体所属的类别，是计算机视觉中最基础的任务。经典数据集如 ImageNet 极大推动了该方向的发展。&lt;br /&gt;
&lt;br /&gt;
=== 目标检测 ===&lt;br /&gt;
在图像中定位并识别出多个物体，输出每个物体的类别与位置（边界框）。代表性方法包括 R-CNN 系列、YOLO 系列等。&lt;br /&gt;
&lt;br /&gt;
=== 图像分割 ===&lt;br /&gt;
将图像划分为若干具有语义意义的区域，可细分为语义分割、实例分割与全景分割，广泛应用于医学影像与自动驾驶。&lt;br /&gt;
&lt;br /&gt;
=== 目标跟踪 ===&lt;br /&gt;
在视频序列中持续定位特定目标，是视频分析与监控的关键技术。&lt;br /&gt;
&lt;br /&gt;
=== 三维视觉 ===&lt;br /&gt;
从二维图像中恢复三维结构，包括立体视觉、深度估计、三维重建与点云处理等。&lt;br /&gt;
&lt;br /&gt;
== 关键技术与方法 ==&lt;br /&gt;
&lt;br /&gt;
=== 传统方法 ===&lt;br /&gt;
在深度学习兴起之前，计算机视觉主要依赖人工特征提取（如 SIFT、HOG）结合支持向量机等分类器，以及图像处理中的滤波、边缘检测、形态学操作等技术。&lt;br /&gt;
&lt;br /&gt;
=== 卷积神经网络 ===&lt;br /&gt;
卷积神经网络（CNN）通过局部连接与权值共享高效提取图像的层次化特征，是现代计算机视觉的基石。经典网络包括 AlexNet、VGG、ResNet 等。&lt;br /&gt;
&lt;br /&gt;
=== 视觉 Transformer ===&lt;br /&gt;
近年来，源自 [[自然语言处理]] 的 Transformer 架构被引入视觉领域，提出了 Vision Transformer（ViT）等模型，在大规模数据上展现出强大性能。&lt;br /&gt;
&lt;br /&gt;
=== 生成模型 ===&lt;br /&gt;
生成对抗网络（GAN）与扩散模型（Diffusion Model）能够生成逼真的图像，推动了图像生成、编辑与超分辨率等应用的发展。&lt;br /&gt;
&lt;br /&gt;
== 典型应用 ==&lt;br /&gt;
&lt;br /&gt;
计算机视觉的应用已深入日常生活与各行各业。在 &amp;#039;&amp;#039;&amp;#039;医疗健康&amp;#039;&amp;#039;&amp;#039; 领域，它用于医学影像的病灶检测与辅助诊断；在 &amp;#039;&amp;#039;&amp;#039;自动驾驶&amp;#039;&amp;#039;&amp;#039; 领域，它负责环境感知、车道识别与障碍物检测；在 &amp;#039;&amp;#039;&amp;#039;工业制造&amp;#039;&amp;#039;&amp;#039; 领域，它用于产品质检与缺陷识别；在 &amp;#039;&amp;#039;&amp;#039;安防监控&amp;#039;&amp;#039;&amp;#039; 领域，它支持人脸识别与行为分析；此外，在增强现实、零售、农业等领域也有广泛应用。值得一提的是，计算机视觉与 [[生物信息学]] 的结合（如细胞图像分析、医学影像组学）正成为连接信息技术与生命科学的重要桥梁。&lt;br /&gt;
&lt;br /&gt;
== 挑战与发展趋势 ==&lt;br /&gt;
&lt;br /&gt;
尽管计算机视觉取得了长足进步，但仍面临诸多挑战：模型对数据分布变化的鲁棒性不足、对大规模标注数据的依赖、计算资源消耗大，以及在安全敏感场景中的可解释性问题（参见 [[AI 伦理与安全]]）。未来的发展趋势包括自监督与少样本学习、多模态融合（视觉与语言结合）、轻量化模型部署，以及与具身智能的深度结合。&lt;br /&gt;
&lt;br /&gt;
== 相关条目 ==&lt;br /&gt;
&lt;br /&gt;
* [[人工智能]]&lt;br /&gt;
* [[机器学习]]&lt;br /&gt;
* [[深度学习]]&lt;br /&gt;
* [[自然语言处理]]&lt;br /&gt;
* [[AI 伦理与安全]]&lt;br /&gt;
&lt;br /&gt;
== 参考与延伸阅读 ==&lt;br /&gt;
&lt;br /&gt;
* 计算机视觉经典教材与综述文献&lt;br /&gt;
* 主流模型架构（CNN、ViT、扩散模型）相关论文&lt;br /&gt;
* ImageNet、COCO 等公开数据集资料&lt;br /&gt;
&lt;br /&gt;
[[分类:人工智能]]&lt;br /&gt;
[[分类:计算机视觉]]&lt;br /&gt;
[[分类:深度学习]]&lt;/div&gt;</summary>
		<author><name>WikiAdmin</name></author>
	</entry>
</feed>