2025年2月24日 星期一 甲辰(龙)年 腊月廿四 设为首页 加入收藏
rss
您当前的位置:首页 > 计算机 > 编程开发 > Python

python语言转换库snowballstemmer

时间:08-21来源:作者:点击数:23

python语言转换库snowballstemmer

安装

  • pip install snowballstemmer

这是一款非常瘦小的语言转换库,支持15种语言。

  • 'danish': 丹麦语,
  • 'dutch': 荷兰语,
  • 'english': 英语,
  • 'finnish': 芬兰语,
  • 'french': 法语,
  • 'german': 德语,
  • 'hungarian': 匈牙利语,
  • 'italian': 意大利语,
  • 'norwegian': 挪威语,
  • 'porter': 波特语,
  • 'portuguese': 葡萄牙语,
  • 'romanian': 罗马尼亚语,
  • 'russian': 俄语,
  • 'spanish': 西班牙语,
  • 'swedish': 瑞典语,
  • 'turkish': 土耳其语,

snowballstemmer模块有两个功能

snowballstemmer.algorithms函数报道查看一个可用的算法名称“字符串列表。

  • import snowballstemmer
  • >>> snowballstemmer.algorithms()
  • ['danish', 'dutch', 'english', 'finnish', 'french', 'german', 'hungarian', 'italian', 'norwegian', 'porter', 'portuguese', 'romanian', 'russian', 'spanish', 'swedish', 'turkish']

该snowballstemmer.stemmer函数接受算法名称并报道查看Stemmer对象。

Stemmer有对象Stemmer.stemWord(word)方法状语从句:Stemmer.stemWords(word[])方法。

  • import snowballstemmer
  • stemmer = snowballstemmer.stemmer('english');
  • print(stemmer.stemWords("We are the world".split()));
  • ['We', 'are', 'the', 'world']
  • from snowballstemmer import EnglishStemmer, SpanishStemmer
  • EnglishStemmer().stemWord("Gregory")
  • # Gregori
  • SpanishStemmer().stemWord("amarillo")
  • # amaril

参考:https://pypi.org/project/snowballstemmer/

https://github.com/shibukawa/snowball_py

方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门
本栏推荐