keybert:基于bert模型的关键词抽取工具
github:https://github.com/MaartenGr/KeyBERTguides:https://maartengr.github.io/KeyBERT/guides/quickstart.html使用向量计算抽取关键词,只需要预训练模型,不需要额外模型训练。流程:1.没有提供分词功能,英文是空格分词,中文输入需要分完词输入。2.选择候选词:默认使用CountVectorizer
·
github:https://github.com/MaartenGr/KeyBERT
guides:https://maartengr.github.io/KeyBERT/guides/quickstart.html
使用向量计算抽取关键词,只需要预训练模型,不需要额外模型训练。
流程:
1.没有提供分词功能,英文是空格分词,中文输入需要分完词输入。
2.选择候选词:默认使用CountVectorizer进行候选词选择。
3. model:默认方式,候选词向量和句向量的距离排序。
mmr:最大边际距离方法,保证关键词之间的多样性。考虑词之间的相似性。
max_sum:候选词之间相似和最小的组合。
更多推荐
所有评论(0)