Jump to content
Main menu
Main menu
move to sidebar
hide
Navigation
Main page
Recent changes
Random page
Help about MediaWiki
Special pages
Wiki
Search
Search
Appearance
Create account
Log in
Personal tools
Create account
Log in
Pages for logged out editors
learn more
Contributions
Talk
Editing
自然语言处理
Page
Discussion
English
Read
Edit
View history
Tools
Tools
move to sidebar
hide
Actions
Read
Edit
View history
General
What links here
Related changes
Page information
Appearance
move to sidebar
hide
Warning:
You are not logged in. Your IP address will be publicly visible if you make any edits. If you
log in
or
create an account
, your edits will be attributed to your username, along with other benefits.
Anti-spam check. Do
not
fill this in!
'''自然语言处理'''(英语:'''Natural Language Processing''',缩写 '''NLP''')是人工智能与语言学的交叉分支,研究如何使计算机理解、解析、生成与运用人类的自然语言。其目标是弥合人类语言与机器表示之间的鸿沟,让计算机能够像人一样"读懂"文字与语音,并以自然的方式与人交流。作为 [[人工智能]] 的核心领域之一,自然语言处理是 [[大语言模型]]、机器翻译、智能问答等技术的理论基础。 == 概述 == 自然语言具有高度的歧义性、灵活性与上下文依赖性,同一句话在不同语境下可能含义迥异,这使得让计算机准确理解语言成为一项艰巨的任务。自然语言处理需要综合运用语言学知识、统计方法与机器学习技术,从词、句、篇章等多个层次对语言进行建模。 该领域的发展大致经历了三个阶段:早期基于规则与语法的符号方法、20 世纪 90 年代兴起的统计学习方法,以及 2010 年代后由 [[深度学习]] 驱动的神经网络方法。尤其是 2017 年 Transformer 架构的提出,彻底改变了这一领域的技术格局。 == 核心任务 == === 词法与句法分析 === 包括分词、词性标注、命名实体识别与句法依存分析等,旨在解析语言的基本结构。中文等语言由于缺乏天然词边界,分词本身即是一项重要任务。 === 语义理解 === 研究如何让计算机理解文本的含义,涵盖词义消歧、语义角色标注、指代消解等任务,是实现深层语言理解的关键。 === 文本分类与情感分析 === 将文本归入预定义类别(如垃圾邮件识别),或判断文本所表达的情感倾向,广泛应用于舆情监测与商业分析。 === 机器翻译 === 将一种自然语言自动翻译为另一种语言,从早期的统计机器翻译发展到如今基于神经网络的端到端翻译,质量已大幅提升。 === 文本生成与问答 === 包括自动摘要、对话生成、阅读理解与开放域问答等,是当前大语言模型最具代表性的应用方向。 == 关键技术与方法 == === 传统方法 === 早期自然语言处理依赖人工编写的语法规则与词典,后发展为基于统计的 n-gram 语言模型、隐马尔可夫模型(HMM)与条件随机场(CRF)等概率方法。 === 词向量与表示学习 === Word2Vec、GloVe 等词嵌入技术将词语映射为稠密向量,使语义相近的词在向量空间中彼此接近,为神经网络处理语言奠定了基础。 === 循环神经网络 === 循环神经网络(RNN)及其变体长短期记忆网络(LSTM)擅长处理序列数据,曾长期是机器翻译与文本生成的主流架构。 === Transformer 与预训练模型 === 2017 年提出的 Transformer 架构凭借自注意力机制高效建模长距离依赖,催生了 BERT、GPT 等预训练语言模型。"预训练 + 微调"范式成为现代自然语言处理的标准方法,并最终演化出参数规模庞大的 [[大语言模型]]。 == 典型应用 == 自然语言处理已深度融入日常生活与各行各业。在 '''智能助手''' 与 '''对话系统''' 中,它支撑着语音助手与客服机器人的交互;在 '''搜索引擎''' 中,它用于理解查询意图与匹配相关内容;在 '''机器翻译''' 中,它打破了跨语言沟通的壁垒;在 '''内容创作''' 领域,它支持文本生成、润色与摘要。值得关注的是,自然语言处理与 [[生物信息学]] 的结合日益紧密——例如将蛋白质序列、基因序列视为"语言"进行建模,借助语言模型的思想解析生命的"密码",正成为连接信息技术与生命科学的前沿方向。 == 挑战与发展趋势 == 尽管以大语言模型为代表的技术取得了突破性进展,自然语言处理仍面临诸多挑战:模型可能生成看似合理实则错误的内容(幻觉问题)、对低资源语言支持不足、推理与常识能力有限,以及训练与部署的高昂成本。此外,模型的偏见、隐私与可解释性问题也引发广泛关注(参见 [[AI 伦理与安全]])。未来的发展趋势包括多模态融合(语言与视觉、语音结合)、增强模型的推理与规划能力、知识与大模型的结合,以及更高效的训练与推理方法。 == 相关条目 == * [[人工智能]] * [[机器学习]] * [[深度学习]] * [[大语言模型]] * [[计算机视觉]] * [[AI 伦理与安全]] == 参考与延伸阅读 == * 自然语言处理经典教材与综述文献 * Transformer、BERT、GPT 等模型相关论文 * 主流 NLP 开源工具与数据集资料 [[分类:人工智能]] [[分类:自然语言处理]] [[分类:深度学习]]
Summary:
Please note that all contributions to Wiki may be edited, altered, or removed by other contributors. If you do not want your writing to be edited mercilessly, then do not submit it here.
You are also promising us that you wrote this yourself, or copied it from a public domain or similar free resource (see
Wiki:Copyrights
for details).
Do not submit copyrighted work without permission!
Cancel
Editing help
(opens in new window)
Search
Search
Editing
自然语言处理
Add topic