当前位置:首页 > 自然语言处理 > 正文

自然语言处理技术的三个发展阶段


第一阶段:规则型 NLP(20 世纪 50-70 年代)
特征:
基于手工制作的规则。
重点是语法和词法分析。
只能处理简单句式和有限的语言。
示例:
词形还原器(stemmer)
句法解析器
第二阶段:统计型 NLP(20 世纪 80-2000 年代)
特征:
利用统计方法,如 n 元语法和隐马尔可夫模型(HMM)。
重点是机器学习和概率。
能够处理更复杂的语言和更大的数据集。
示例:
词袋模型(bag-of-words)
语言模型
信息抽取工具
第三阶段:神经型 NLP(2010 年代至今)
特征:
使用神经网络(如卷积神经网络(CNN)和递归神经网络(RNN))。
能够对文本进行深度学习,捕捉更复杂的语言结构和语义。
取得了显着进步,达到了或超过了人类表现。
示例:
语言 BERT(Bidirectional Encoder Repre sentations from Transformers)
GPT-3(Generative Pre-trained Transformer 3)
神经机器翻译模型