|
课程介绍:
9 Q y& `7 z7 M$ T$ T/ b 本课程是炼数成金自然语言处理系列课程中的第二门课(第一门课是《机器读心术之文本挖掘与自然语言处理》),这是一门基于Python实践自然语言处理典型应用场景的实战课程。自然语言,作为人类情感思想最基本、最直接、最方便的表达工具,无时无刻不充斥在世界的每个角落。随着信息时代的到来,越来越多的自然语言被以各种方式记录下来,是我们面对最多的数据类型。然而,由于自然语言的多样性、灵活性与广泛性,在过去我们并无合适的处理手段,自然语言处理技术近几十年来的迅猛发展,特别是近年来基于统计和机器学习手段的兴起,为解决这一高难应用领域带来曙光。: ]8 | G+ m5 P% F% r
自然语言处理是机器学习当前最神秘,最红火,最具难度,也最让引人关注的分支。在搜索引擎,语音识别,情感分析,大批量文档处理,机器翻译,自动应答等各个领域有着前程无可限量的应用。可以试想一台能理解自然语言,并且和人类能用语言纯熟交流的机器,那还能叫机器么?文本挖掘(Text Mining)是数据挖掘以及自然语言处理技术衍生的一个分支,挖掘对象通常是非结构化的文本数据,常见的文本挖掘对象包括网页所产生的BBS留言、博客、微博、新闻跟贴与转贴等。此外,拥有大型呼叫中心或邮件系统的企业,call center或mail积攒下来的大量语言记录也可以通过文本挖掘获得众多具有商业价值的知识。我们用计算机去处理文字,语音,理解语言,这些本来是高等生物人类才能做的事情,使到系统能产生“机器也具有人类同样的智慧”的震惊效果,无需置疑肯定会给顾客和观众留下极其深刻的印象。
8 A; \+ _0 v) }) ]* _ Python作为一门主流的编程语言,在自然语言的处理中也是有非常多的应用。那么就让我们一起来学习怎么使用Python进行自然语言处理吧! , U- N- ~' A5 o5 K$ b" A# p
& u# ?6 x5 o9 D1 m7 L" o% ?) \% J0 a
% m9 K; X; r4 y# ]* k' k: i课程大纲:2 m, t. }0 F) Q
第一课:自然语言分析利器——Python入门& t; r% m( H6 s/ ]. n. r7 H' K1 m! x. _6 ?! |7 o: @
第二课:自然语言分析工具包——NLTK入门。编程实战:NLTK包的安装与常用方法介绍. g/ B: V) y; F& o3 _
第三课:语料库的获取与词频分析。编程实战:词条频率分布图的绘制; W- G: }$ l5 `2 _; a
第四课:原始文本资料的读取与处理。编程实战:使用正则表达式实现英文分词. c$ k0 {3 B" y- S/ a
第五课:中文分词的算法与实现。编程实战:结巴分词器的使用# @% S4 F( y, M( Z3 w
N3 g6 I; R. b, O+ C 第六课:词条分类与词条属性。编程实战:中英文词性标注- U& _& N; e9 H. _! l) v, i; ~( v! x8 A' u) e
第七课:文本挖掘之文本分类器。编程实战:新闻类别分类' l! ]+ e% w: G, P/ ^* {7 j8 o z: V$ q/ }( J0 P7 P8 \% a) T
第八课:文本挖掘之文本聚类。编程实战:百度词条聚类分析+ K8 ^! T6 {1 u4 U- S- _! i' u" I; z5 S! I
第九课:文本信息提取。编程实战:结构化数据提取系统
7 ~7 [6 }% M7 W- z 第十课:句子语法分析。编程实战:自动语法树构建系统 i. W3 a2 m+ e$ c/ e3 H4 H8 f8 f* ^& @, I V1 E; P
第十一课:让计算机读懂我们——文本语义分析实现。编程实现:智能问答系统8 ^/ y( [' K& z O, ^
1 U( N2 L, V" ~6 Y- V 第十二课:语言数据管理。编程实践:语料库的设计与创建: E3 U7 T: @, C2 l: G' F0 J
; D. M+ {0 X# k9 E: w
5 T7 X6 `' B8 W: h: g4 G0 M开课时间:
9 Y0 l. {% X6 U( @; I 预计11月28日开课,预计课程持续时间为14周, F- ~' z! |; \* S! Y
; P% x- _- A2 o3 Q. V
2 R4 ]2 W( ]/ M# K目标人群:2 O& t4 n ^9 i5 F* m p
- p, ~8 M' J/ \% B# E 对自然语言处理感兴趣的学员;7 Q) j9 y4 h# y4 J' G$ B. ]& \
, Q% C/ Q/ L O" \* ]/ P
$ _6 y5 Q V' d课程环境:8 f; H. y) I0 M3 A2 [
Python 2.x. @, b4 t. q+ \ z0 Q: }) }) z) C) { Y% e% f! {
& I( |6 G, b3 B, [
' d8 Q/ O$ Y9 F' E4 G7 K' G9 R收获预期:9 T# r4 y7 I8 Q8 N/ m
. H( x/ R5 S, `5 T) s1 v" i( U 知道如何利用Python进行自然语言处理与分析,并可以熟练使用Python进行自然语言处理与分析5 I; D4 ]+ d! ]& g' |6 b0 M7 s
1 H: P' S: K% N
- j1 U# @. H$ n$ f$ h/ ~' e5 z授课讲师:5 d( T6 _# U6 b! Z& c6 q
何翠仪,毕业于中山大学统计学专业,炼数成金专职讲师。
- {7 l# e- ?- \ 在炼数成金上开设了多门关于数据分析与数据挖掘相关的课程,如《大数据的统计学基础》、《大数据的矩阵基础》《金融时间序列分析》等,也曾到不同的公司开展R语言与数据分析的相关培训。对数据分析有深刻认识,曾与不同领域公司合作,参与到多个数据分析的项目中,如华为、广州地铁等
2 k/ I. U: q+ M7 v/ Y5 r6 }0 V" O) R
& i" Q; v: P. f& X6 t7 B+ U% ?" x* v7 ]( G! Y
5 j6 Z5 G$ P5 C6 a8 x: c, [, }5 v1 p4 I3 U' P! r
: m# M& @0 o0 h& a6 I
资源下载地址和密码(百度云盘): [/hide] 百度网盘信息回帖可见; C, D5 r- A A' p! C: Y$ r
! t1 n( w9 S5 o$ i2 E8 `, G
* B8 W& O( u0 n9 t% }7 X2 h7 `7 S. L$ ~% B5 b) m
本资源由Java自学网收集整理【www.javazx.com】 |
|