Python有趣库分享-xpinyin|Python 主题月

本文正在参加「Python主题月」,详情查看 活动链接

1. 前言

今天分享一个将汉字转拼音的第三方库: xpinyin,大家可以看看自己的语文是不是不及格,玩笑…

? github链接: xpinyin

2. 安装

python3 -m pip install xpinyin
复制代码

3. 示例-使用

3.1 获取拼音,默认分隔符为’-‘

>>> from xpinyin import Pinyin
>>> p = Pinyin()
>>> p.get_pinyin('北京')
'bei-jing'
复制代码

3.2 拼音带有声调

# 显示音调
>>> p.get_pinyin('北京', tone_marks='marks')
'běi-jīng'

# 显示音调的声调数字
>>> p.get_pinyin('北京', tone_marks='numbers')
'bei3-jing1'
复制代码

3.3 改变不同的分隔符

通过更改 splitter 参数控制

# 分隔符为空格
>>> p.get_pinyin('北京', tone_marks='marks', splitter=' ')
'běi jīng'

>>> p.get_pinyin('北京', tone_marks='numbers', splitter=' ')
'bei3 jing1'

# 不带分隔符
>>> p.get_pinyin('北京', tone_marks='marks', splitter='')
'běijīng'

>>> p.get_pinyin('北京', tone_marks='numbers', splitter='')
'bei3jing1'
复制代码

3.4 获取声母

  • 平舌音
>>> p.get_initials("上海", splitter='-')
'S-H'
复制代码
  • 翘舌音
>>> p.get_initials("上海", splitter='-', with_retroflex=True)
'SH-H'
复制代码

3.5 获取汉字的多音组合

由于中文汉字往往具备多音的特性,该库也可展示一字多音的情况

>>> p.get_pinyins('模样')
['mo-yang', 'mo-xiang', 'mu-yang', 'mu-xiang']

>>> p.get_pinyins('模样', tone_marks='marks', splitter=' ')
['mó yáng', 'mó yàng', 'mó xiàng', 'mú yáng', 'mú yàng', 'mú xiàng']

>>> p.get_pinyins('伤害', tone_marks='marks', splitter=' ')
['shāng hài', 'shāng hé']
复制代码

4. 最后

这个库挺不错的,比如模样,我都不知道 还有 xiang 这个音,he 这个音。

汗颜?,中华文化博大精深,感觉语文都可以再回炉重造了。

感兴趣的朋友,可以去 github 下探索一下,作者是维护了一个 mandarin.dat 文件,记录了汉字的十六进制和拼音及音调。

再贴一次链接:? xpinyin

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享