X hits on this document

115 views

0 shares

0 downloads

0 comments

7 / 25

北京大学学士学位论文

        HTTP            HTTP                         NNTP

     HTML                    HTML                      News

   存取分析                 存取分析                  存取分析

   SOIF内部接口      SOIF内部接口  SOIF内部接口

                    主控模块

                            DB1             DB2

                                       检索服务器

         索引数据

           库

                     Email接口处理                          WWW接口处理

                      Sendmail                           httpd

                        电子邮件                               浏览器

2.1

4.

中文信息处理技术

中文信息处理与英文存在很大不同,这是因为中文信息处理具有很多自己的特点,这使中文信息的词语切分(切词)成为汉语信息处理的第一道关口,也是建立中文信息发现和检索系统的关键性技术之一。我们使用以带词类标记的词典为基础、以切词与标注相结合的方法处理中文信息,较好地解决了汉语的切词问题。

7

Document info
Document views115
Page views115
Page last viewedThu Dec 08 12:54:25 UTC 2016
Pages25
Paragraphs544
Words834

Comments