百度 LAC 基于开源代码编译以及使用示例,Linux系统版本Java调用所需的liblacjni.so SO文件
1、github地址:https://github.com/baidu/lac;下文中描述的编译步骤中已经编译好的Linux版本的so文件,liblacjni.so 下载地址:https://download.csdn.net/download/changingshow/20630701下文中描述的编译步骤中已经编译好的windows版本下载地址:编译好的dll文件下载地址:https://dow
1、github地址:https://github.com/baidu/lac;
下文中描述的编译步骤中已经编译好的Linux版本的so文件,liblacjni.so 下载地址:
https://download.csdn.net/download/changingshow/20630701
下文中描述步骤里面的Linux预测库文件下载地址:
https://download.csdn.net/download/changingshow/20631163
2、简介:LAC全称Lexical Analysis of Chinese,是百度自然语言处理部研发的一款联合的词法分析工具,实现中文分词、词性标注、专名识别等功能。

3、我的需求是,对文章进行分词,并可以通过加载自定义的模型文件进行分词,根据返回的结果,进行下一步业务处理。比如,我希望文章中出现 “天气真好”四个字的时候,可以把这四个字当成一个词语返回回来,并且携带我自定义的“词性”比如,“good_day”。
4、上文说到Windows系统下所需的dll文件官方提供的有问题,自己编译了一个版本,如果程序需要运行在Linux服务器上面,就需要编译so文件,这个文件官方未提供。
5、官方提供的编译过程文档地址:https://github.com/baidu/lac/tree/master/java
6、开始编译
①下载Linux预测库,官方提供的地址有问题不能直接下载,正确的下载地址是:
https://paddleinference.paddlepaddle.org.cn/user_guides/download_lib.html

下载最新版本总是没错的。下载之后,直接用xftp拉到服务器指定目录,解压

②安装CMAKE,下载地址:https://cmake.org/download/

下载之后,直接解压,然后设置环境变量,运行cmake --version验证是否安装成功

③开始编译:

流程就是拉代码,然后进入指定目录,设置paddle目录和jdk目录,编译过程中出现如下报错。
是需要安装gcc。

④安装gcc-c++ 运行yum install gcc-c++

清空一下build下面的文件,重复上述步骤,这块有个小坑,因为我刚编译完windows版本的,然后直接把项目拉到服务器,然后进行编译,出现一些报错,是因为项目的cmakelist.txt文件被我修改了,把这个文件还原即可。

⑤编译完成,项目output->java目录文件如下,需要的就是liblacjni.so文件。

⑥测试:修改编译目录里面的LacDemo.java文件,加载so文件、加载模型文件、加载自定义文件

结束。
更多推荐

所有评论(0)