本文正在参加「Python主题月」,详情查看 活动链接
1. 前言
今天分享一个将汉字转拼音的第三方库: xpinyin,大家可以看看自己的语文是不是不及格,玩笑…
? github链接: xpinyin
2. 安装
python3 -m pip install xpinyin
复制代码
3. 示例-使用
3.1 获取拼音,默认分隔符为’-‘
>>> from xpinyin import Pinyin
>>> p = Pinyin()
>>> p.get_pinyin('北京')
'bei-jing'
复制代码
3.2 拼音带有声调
# 显示音调
>>> p.get_pinyin('北京', tone_marks='marks')
'běi-jīng'
# 显示音调的声调数字
>>> p.get_pinyin('北京', tone_marks='numbers')
'bei3-jing1'
复制代码
3.3 改变不同的分隔符
通过更改 splitter
参数控制
# 分隔符为空格
>>> p.get_pinyin('北京', tone_marks='marks', splitter=' ')
'běi jīng'
>>> p.get_pinyin('北京', tone_marks='numbers', splitter=' ')
'bei3 jing1'
# 不带分隔符
>>> p.get_pinyin('北京', tone_marks='marks', splitter='')
'běijīng'
>>> p.get_pinyin('北京', tone_marks='numbers', splitter='')
'bei3jing1'
复制代码
3.4 获取声母
- 平舌音
>>> p.get_initials("上海", splitter='-')
'S-H'
复制代码
- 翘舌音
>>> p.get_initials("上海", splitter='-', with_retroflex=True)
'SH-H'
复制代码
3.5 获取汉字的多音组合
由于中文汉字往往具备多音的特性,该库也可展示一字多音的情况
>>> p.get_pinyins('模样')
['mo-yang', 'mo-xiang', 'mu-yang', 'mu-xiang']
>>> p.get_pinyins('模样', tone_marks='marks', splitter=' ')
['mó yáng', 'mó yàng', 'mó xiàng', 'mú yáng', 'mú yàng', 'mú xiàng']
>>> p.get_pinyins('伤害', tone_marks='marks', splitter=' ')
['shāng hài', 'shāng hé']
复制代码
4. 最后
这个库挺不错的,比如模样,我都不知道 样
还有 xiang
这个音,害
有 he
这个音。
汗颜?,中华文化博大精深,感觉语文都可以再回炉重造了。
感兴趣的朋友,可以去 github 下探索一下,作者是维护了一个 mandarin.dat
文件,记录了汉字的十六进制和拼音及音调。
再贴一次链接:? xpinyin
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END