Jieba库的使用

函数	描述
jieba.cut(s)	精确模式，返回一个可迭代的数据类型
jieba.cut(s, cut_all=True)	全模式，输出文本s中所有可能单词
jieba.cut_for_search(s)	搜索引擎模式，适合搜索引擎建立索引的分词结果
jieba.lcut(s)	精确模式，返回一个列表类型的分词结果 >>> jieba.lcut( " 中国是一个伟大的国家 " ) [' 中国 ', ' 是 ', ' 一个 ', ' 伟大 ', ' 的 ', ' 国家 ']
jieba.lcut(s, cut_all=True)	全模式，返回一个列表类型的分词结果，存在冗余 >>> jieba.lcut( " 中国是一个伟大的国家 " ,cut_all=True) [' 中国 ', ' 国是 ', ' 一个 ', ' 伟大 ', ' 的 ', ' 国家 ']
jieba.lcut_for_search(s)	搜索引擎模式，返回一个列表类型的分词结果，存在冗余 >>> jieba.lcut_for_search( “ 中华人民共和国是伟大的 " ) [' 中华 ', ' 华人 ', ' 人民 ', ' 共和 ', ' 共和国 ', ' 中华人民共和国 ', ' 是 ', ' 伟大 ', ' 的 ']
jieba.add_word(w)	向分词词典增加新词w >>> jieba.add_word( " 蟒蛇语言 " )

其实最最常用的就是jieba.lcut(s)

推荐阅读：

“《三国演义》人物出场统计“实例讲解

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

从 0 到 1 复现 AI 绘画：手把手教你写一个能用的 Diffusion 脚本

本文通过一个轻量级MNIST扩散模型代码，解析AI图像生成的核心原理。

2048 AI社区

生产级智能体RAG入门指南（6种RAG模式详解含示例）

2048 AI社区

weixin222基于微信小程序的在线学习系统springboot(文档+源码)_kaic

进入到这个环节，也就可以及时检查出前面设计的需求是否可靠了。一个设计良好的方案在运用于系统实现中，是会帮助系统编制人员节省时间，并提升开发效率的。所以在系统的编程阶段，也就是系统实现阶段，对于一些不合理的设计需求，也是可以及时发现。因为设计的方案是完全指导系统的编码过程的。如图5.1显示的就是用户信息管理页面，此页面提供给管理员的功能有：用户信息的查询管理，可以删除用户信息、修改用户信息、新增用户