您当前的位置:首页 > 计算机 > 编程开发 > Python

浅析Python谷歌翻译库的核心

时间:04-23来源:作者:点击数:

随着现在谷歌翻译的准确度越来越高,大部分人们不约而同的选择了谷歌翻译。对于Python而言,现在的googletrans可谓是使用的很顺心。对于googletrans这个库的client文件中的Translator类的translate方法,我在此简单剖析以下:首先对语种进行判断,判断是否在语言库里,然后生成data参数【以前访问谷歌还需要g_tk参数计算,不知道为什么访问起来越来越简单了】,谷歌的请求界面采用POST方法,一些参数暂时不变,唯一变的是data中的f.req参数,他由原文、原语种、目标语种组成,自己实现就是:

json.dumps([[['MkEWBc', json.dumps([[text, src, des, True], [None]]), None, 'generic']]])

然后直接POST得到了结果,比较麻烦的就是对返回结果的处理,但多用几次根据规律还是很好得到具体处理方案的:

for row in res.text.split('\n'):
    try:
        try:
            data = eval(eval(row.replace('null', 'None').replace('true', 'True').replace('false', 'False'))[0][2])
            # 获取原语种
            if src == 'auto':
                try:
                    src = data[2]
                except IndexError:
                    pass
            if src == 'auto':
                try:
                    src = data[0][2]
                except IndexError:
                    pass
            print(f"原语种:{src},原文:\n{text}\n\n翻译语种:{des},翻译文:\n{(' 'if data[1][0][0][3] else '').join([_[0] for _ in data[1][0][0][5]])}")
            break
        except IndexError:
            pass
        except TypeError:
            pass
    except SyntaxError:
        pass
else:
    print('未获取正确的翻译结果!')

连json都不用直接eval获取列表就可以了,通过异常判断获取所需要的有结果的那行,把这些综合在一起,写成一个不考虑语言、不依赖除requests其他第三方库的简单程序就是:

# _*_ coding:utf-8 _*_
# FileName: google_translate.py
# IDE: PyCharm
# 菜菜代码,永无BUG!

import json
import requests

text = '苹果\n香蕉'  # 待翻译文本
src = 'auto'  # 原文本语种
des = 'en'  # 翻译文语种

res = requests.post(
    url="https://translate.google.cn/_/TranslateWebserverUi/data/batchexecute?rpcids=MkEWBc&bl=boq_translate-webserver_20210929.09_p0&hl=zh-CN&soc-app=1&soc-platform=1&soc-device=1&rt=c",
    data={"f.req": json.dumps([[['MkEWBc', json.dumps([[text, src, des, True], [None]]), None, 'generic']]])}
)

for row in res.text.split('\n'):
    try:
        try:
            data = eval(eval(row.replace('null', 'None').replace('true', 'True').replace('false', 'False'))[0][2])
            # 获取原语种
            if src == 'auto':
                try:
                    src = data[2]
                except IndexError:
                    pass
            if src == 'auto':
                try:
                    src = data[0][2]
                except IndexError:
                    pass
            print(f"原语种:{src},原文:\n{text}\n\n翻译语种:{des},翻译文:\n{(' 'if data[1][0][0][3] else '').join([_[0] for _ in data[1][0][0][5]])}")
            break
        except IndexError:
            pass
        except TypeError:
            pass
    except SyntaxError:
        pass
else:
    print('未获取正确的翻译结果!')

简单点写成函数就可以任由自己使用了,这不到40行的代码是不是能让你心动呢~

方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门