Google翻訳がディープラーニングで劇的改善と聞いて、PubMed翻訳を比較してみた

Google翻訳のディープラーニング導入、日本語にも適用

昨日から今朝にかけ、ネット上では「Google翻訳の精度が劇的に向上した」との声が多く呟かれ話題になっています。米Googleは9月下旬にディープラーニングを用いた新たな翻訳システム「Google Neural Machine Translation(GNMT)」の開発を発表し、中国語の英訳を皮切りに順次他言語へも導入するとしていましたが、日本語対応が完了したようです。そこでさっそく、自然科学論文の検索ができる世界最大のデータベースPubMedの論文の日本語訳をいくつか試してみます。せっかくですので、競合と思われる同様の論文翻訳サービスの無料版とも比較してみようと思います。

例文その1:専門用語があまり使われていない科学論文

最初は比較的専門用語が少ないと思われる論文で試してみました。人工知能に関する論文です。

原文 PMID: 25073180
A decision-support framework for promoting independent living and ageing well.

Abstract
Artificial intelligence and decision support systems offer a plethora of health monitoring capabilities in ambient assisted living environment. Continuous assessment of health indicators for elderly people living on their own is of utmost importance, so as to prolong their independence and quality of life. Slow varying, long-term deteriorating health trends are not easily identifiable in seniors. Thus, early sign detection of a specific condition, as well as, any likely transition from a healthy state to a pathological one are key problems that the herein proposed framework aims at resolving. Statistical process control concepts offer a personalized approach toward identification of trends that are away from the atypical behavior or state of the seniors, while fuzzy cognitive maps knowledge representation and inference schema have proved to be efficient in terms of disease classification. Geriatric depression is used as a case study throughout the paper, so to prove the validity of the framework, which is planned to be pilot tested with a series of lone-living seniors in their own homes.


某翻訳サービスA(46万語の医療辞書を搭載した無料翻訳サービス:抄録のみ)
人工知能と意志決定支援システムは、環境によって援助された生活環境であり余る程の健康管理能力を提供する。それらの独立と生活の質を延長するように、単独で生きている高齢者のための健康指標の継続評価は、最大の重要性である。ゆっくり様々な、長期の悪化している健康傾向は、シニアで容易に定義可能でない。この中かくして、特異的な状態の徴候検出前半、ならびに、健康的な州から病理学的ものへのどんなありそうな移行でも鍵となる問題であるその、提案されたフレームワークは分解することを意図する。あいまいな認知地図知識表現と推論スキーマが疾患分類に関して効率的であると判明する間、統計工程管理概念はシニアの非定型行動または国から離れている傾向の同定の方へ個人的なことと取られたアプローチを提供する。老年うつ病が、そうフレームワークの有効性を証明するために、自分自身の家で一連の単独の生活シニアと検査を受けるパイロットである計画である論文内の症例研究として使われる。


某翻訳サービスB(高精度自動翻訳、のキャッチフレーズで有名:抄録のみ)
人工知能および意思決定支援システムは、Ambient Assisted Living(AAL)環境で保健モニター機能の過剰を提供する。自立およびクオリティ・オブ・ライフを延長するように、自分で生活している高齢者のための健康指標の継続評価は、最重要事項である。上級はではないゆっくり変化する、長期健康状態の悪化傾向における簡単に識別可能な。このように、健康状態から病理学的ものまでの特定の条件(よくとしての)いかなるおそらく移行の早期符号検出は、herein提案された枠組みが軽快を目指すという重要な問題である。統計プロセスの制御概念は、疾患分類に関してFuzzy認知地図知識表現および推論形式が効率の良いことを証明した一方で、シニアの異常行動または状態を休む傾向同定に向けて個別化されたアプローチを提供する。老年うつ病は、論文全体にケーススタディを用いる。したがって、マイホームに一連のローン生活上級でテストされるパイロットであることを計画される枠組みの有効性を実証する。


Google翻訳(抄録のみ)
人工知能および意思決定支援システムは、周囲の支援された居住環境において過度の健康監視能力を提供する。自立している高齢者の健康指標を継続的に評価することは、自立と生活の質を向上させるために最重要課題です。ゆっくり変化し、長期的に悪化する健康傾向は、高齢者では容易に特定できません。したがって、特定の状態の早期徴候検出、ならびに健康状態から病的状態への任意の可能性のある移行は、本明細書で提案された枠組みが解決を目指す重要な問題である。統計的プロセス制御の概念は、非定型的な行動や高齢者の状態から離れた傾向を識別するためのパーソナライズされたアプローチを提供する一方で、ファジー認知マップの知識表現および推論スキーマは、疾患分類に関して効率的であることが証明されている。高齢者のうつ病は、論文全体のケーススタディとして使用されているので、自宅で孤独な高齢者の一連の試験で試験的に計画されているフレームワークの妥当性を証明するためです。

いかがでしょうか。専門用語の使用頻度が低いのでそちらの検証はあまりできませんが、文章の流暢度、読みやすさはかなりのものではないでしょうか。今度は遺伝子編集に関する論文を試してみます。

例文2:遺伝子科学系論文

原文 PMID: 25188313
Efficient gene knockout in goats using CRISPR/Cas9 system.

Abstract
The CRISPR/Cas9 system has been adapted as an efficient genome editing tool in laboratory animals such as mice, rats, zebrafish and pigs. Here, we report that CRISPR/Cas9 mediated approach can efficiently induce monoallelic and biallelic gene knockout in goat primary fibroblasts. Four genes were disrupted simultaneously in goat fibroblasts by CRISPR/Cas9-mediated genome editing. The single-gene knockout fibroblasts were successfully used for somatic cell nuclear transfer (SCNT) and resulted in live-born goats harboring biallelic mutations. The CRISPR/Cas9 system represents a highly effective and facile platform for targeted editing of large animal genomes, which can be broadly applied to both biomedical and agricultural applications.


某翻訳サービスA(46万語の医療辞書を搭載した無料翻訳サービス:抄録のみ)
CRISPR/Cas9システムは、実験動物(例えばマウス、ラット、ゼブラフィッシュとブタ)における効率的なゲノム編集ツールとして構成された。ここでは、我々は、CRISPR/Cas9によって媒介されるアプローチがヤギ始原線維芽細胞でモノ対立遺伝子および双対立遺伝子の遺伝子ノックアウトを効率的に誘導することができると報告する。4つの遺伝子は、CRISPR/Cas9によって媒介されるゲノム編集によって、ヤギ線維芽細胞で同時に破壊された。単一遺伝子性ノックアウト線維芽細胞が体細胞核移植(SCNT)のためにうまく使われて、双対立遺伝子の突然変異を収容している生産のヤギに帰着した。CRISPR/Cas9システムは大きな動物性ゲノムの目標とされた編集のために極めて効率の高いおよび安易なプラットフォームを意味する。そして、それは生医学的および農業アプリケーションに概して適用されることができる。


某翻訳サービスB(高精度自動翻訳、のキャッチフレーズで有名:抄録のみ)
CRISPR/Cas9システムは、マウス、ラット、ゼブラフィッシュおよび豚のような実験動物における効率的な遺伝子編集ツールとして適合したものとした。ここで、Cas9媒介方法CRISPR /は、効率的にヤギ一次線維芽細胞における単一対立遺伝子性遺伝子ノックアウトおよびbiallelic遺伝子ノックアウトを誘発する可能性があると私たちは報告する。4つの遺伝子は、同時にCRISPR/Cas9-mediatedゲノム編集によるヤギ線維芽細胞内で中断された。単一遺伝子ノックアウト線維芽細胞は、首尾よく体細胞核移植(SCNT)に使用され、うまく蔵匿両アレル性の突然変異である生産のヤギが起こった。CRISPR/Cas9システムは、広く生物医学と農業用途の両方に適用できる大規模動物ゲノムのターゲットの編集のための速やかな改善効果および容易なプラットフォームに相当する。


Google翻訳(抄録のみ)
CRISPR / Cas9システムは、マウス、ラット、ゼブラフィッシュと豚のような実験動物で効率的な遺伝形質編集ツールとして適応したものとした。ここでは、Cas9の実践方法CRISPR /は、効率的にヤギ一次線維芽細胞における単対立遺伝子伝染性遺伝子ノックアウトおよびbiallelic遺伝ノックアウトを誘発する可能性があり、私たちは報告する.4つの遺伝子は、同時にCRISPR / Cas9媒介性ゲノム編集によるヤギ線維芽細胞内で中断された単一遺伝子ノックアウト線維芽細胞は、首尾よく体細胞核移植(SCNT)に使用され、うまく蔵匿りアレル性の突然変異である生産のヤギが起った.CRISPR / Cas9システムは、広く生物医学と農業用途の両方に適用できる大型動物ゲノムのターゲットの編集のための速やか改善効果および容易なプラットフォームに相当する。

専門用語の度合いが増すと文章の構造が分かりづらくなるのか、先ほどの結果と違い読みづらくなりました。しかし「体細胞核移植(SCNT)」といった専門用語、特に名詞は認識できていますね。最後にもうひとつ、医学論文について試してみます。先日こちらも話題になった、二次性白血病に関する論文です。

 

例文3:医学論文

原文 PMID: 24798381
Persistence of cisplatin-induced mutagenicity in hematopoietic stem cells: implications for secondary cancer risk following chemotherapy.

Abstract
Cisplatin is a cytostatic agent used in the treatment of many types of cancer, but its use is associated with increased incidences of secondary leukemia. We evaluated cisplatin’s in vivo genotoxic potential by analyzing peripheral blood for Pig-a mutant phenotype erythrocytes and for chromosomal damage in the form of micronuclei. Mutant phenotype reticuloyte and erythrocyte frequencies, based on anti-CD59 antibody labeling and flow cytometric analysis, were determined in male Sprague Dawley rats treated for 28 consecutive days (days 1-28) with up to 0.4 mg cisplatin/kg/day, and sampled on days -4, 15, 29, and 56. Vehicle and highest dose groups were evaluated at additional time points post-treatment up to 6 months. Day 4 and 29 blood samples were also analyzed for micronucleated reticulocyte frequency using flow cytometry and anti-CD71-based labeling. Mutant phenotype reticulocytes were significantly elevated at doses ≥0.1 mg/kg/day, and mutant phenotype erythrocytes were elevated at doses ≥0.05 mg/kg/day. In the 0.4 mg/kg/day group, these effects persisted for the 6 month observation period. Cisplatin also induced a modest but statistically significant increase in micronucleus frequency at the highest dose tested. The prolonged persistence in the production of mutant erythrocytes following cisplatin exposure suggests that this drug mutates hematopoietic stem cells and that this damage may ultimately contribute to the increased incidence of secondary leukemias seen in patients cured of primary malignancies with platinum-based regimens.


某翻訳サービスA(46万語の医療辞書を搭載した無料翻訳サービス)
造血幹細胞のシスプラチンによって誘発された突然変異誘発性の持続:二次発癌に対する意味は、化学療法に続く危険を冒す。

抄録
シスプラチンは多くの種類の癌の治療で使われる細胞増殖抑制性薬剤である、しかし、その使用は二次性白血病の増加した発生率と関係している。我々は、ピガ変異体表現型赤血球のために、そして、小核の形の染色体損傷のために末梢血を分析することによって、cisplatin\の生体内での遺伝毒性可能性を評価した。変異体表現型reticuloyte、そして、赤血球頻度(抗CD59抗体標識と流れ血球計算分析に基づく)最高0.4mgのシスプラチンで28日連続(日1-28)の治療を受ける男性のSDラットで測定した/kg/日、そして、標本抽出されたついてる日-4、15、29と56。媒体と最も高い用量群は、最高6ヵ月の追加的な時点治療後処置で評価された。4日目と29の血液サンプルは、流動細胞計測法と抗CD71ベースの標識を使用しているマイクロ有核網状赤血球頻度のためにも、分析された。変異体表現型網状赤血球は用量≥0.1mg/kg/日で有意に上昇した、そして、変異体表現型赤血球は用量≥0.05mg/kg/日で上昇した。0.4mg/kg/日の群において、これらの効果は、6ヵ月の観察期間の間持続した。シスプラチンは、検査される最も高い用量で、小核頻度の適度であるが、統計的に有意な増加も誘発した。シスプラチン暴露後の変異体赤血球の産生の長期間にわたる固執は、この薬が造血幹細胞を変異させる、そして、この損傷がプラチナ・ベースの療法で一次性悪性病変の治癒する患者の中に認められる二次性白血病の増加した発生率に最後に貢献する可能性があることを示唆する。


某翻訳サービスB(高精度自動翻訳、のキャッチフレーズで有名)
造血幹細胞でのシスプラチン誘発変異原性の持続: 化学療法以降である二次癌のリスクにおける影響。

抄録
シスプラチンは多くの種類の治療の癌に用いられる細胞増殖抑制剤であるが、使用は二次性白血病の発症率の増加に関連する。私たちは、ピガ変異体表現型赤血球で及び小核の形で、染色体損傷のため末梢血を分析することでシスプラチンのin vivoでの遺伝毒性の可能性を評価した。0.4 mgまでシスプラチン/kg/日を伴った連続28日(日 1-28)の間治療を受け、日-4に試料採取される雄のSD系ラット,15,29,及び56における、変異体表現型reticuloyteおよび赤血球の頻度(抗CD59抗体標識およびフローサイトメトリー解析に基づく)を決定する。溶媒および最高用量群は、追加の時点治療後6ヶ月までで評価された。Day4および29血液サンプルは、またフローサイトメトリーおよび抗CD71基準標識を用いている小核網状赤血球頻度を分析された。変異体表現型網状赤血球は日に有意に用量>=0.1mg/kg/と高値であり、変異体表現型赤血球は、日に用量>=0.05mg/kg/と高値であった。In 0.4 mg/kg /日グループ、これらの効果は、6ヶ月観察期間の間持続した。シスプラチンはまた中程度を誘導した。しかし、最大試験用量での統計的に小核頻度の大幅な増加。この薬剤は造血幹細胞を変異させ、この損傷は最終的にプラチナ製剤ベースのレジメンといる原発悪性疾患を治癒する患者にみられる二次性白血病の発症率の増加に寄与する可能性があると、シスプラチン曝露より後にある変異体の赤血球の生産での長期残留性は示唆する。


Google翻訳
造血幹細胞におけるシスプラチン誘導突然変異原性の持続性:化学療法後の二次的癌リスクへの影響。

抄録
シスプラチンは、多くのタイプの癌の治療に用いられる細胞増殖抑制剤であるが、その使用は二次性白血病の発生率の増加に関連する。我々は、Pig-a突然変異表現型赤血球の末梢血を分析し、小核の形態の染色体損傷について、シスプラチンのin vivo遺伝毒性の可能性を評価した。抗CD59抗体標識およびフローサイトメトリー分析に基づく突然変異表現型網状赤血球および赤血球頻度を、シスプラチン0.4mg / kg /日までの連続28日間(1-28日)処置した雄Sprague Dawleyラットで測定し、サンプリングした-4日、15日、29日および56日目に投与した。ビヒクルおよび最高用量群を、治療後の追加の時点で6ヶ月まで評価した。フローサイトメトリーおよび抗CD71ベースの標識を使用して、小核網状赤血球頻度について4日目および29日目の血液試料も分析した。変異型表現型網状赤血球は、0.1mg / kg /日以上の用量で有意に上昇し、変異型表現型赤血球は、0.05mg / kg /日以上の用量で上昇した。 0.4mg / kg /日群では、これらの効果は6ヶ月の観察期間にわたって持続した。シスプラチンはまた、試験した最高用量で小核頻度の中程度ではあるが統計的に有意な増加を誘導した。シスプラチン曝露後の突然変異赤血球生成の長期持続は、この薬剤が造血幹細胞を変異させることを示唆しており、この損傷はプラチナベースのレジメンによる原発悪性疾患の治癒した患者に見られる二次性白血病の発生率の増加につながる可能性がある。

 

私の推測では、例文2より文章が崩れると思っていたので本当に驚きました。他の専門サービスと比べても、文章の流暢さにおいて上回っているだけでなく、専門用語とそれに付随する「言い回し」についてもかなりの精度で翻訳できていると思います。専門用語の認識については改良の余地は大きそうですが、この論文に限って言えばそれは他の翻訳サービスも同様です。

ディープラーニングの成果が、こうして一般に還元されることは非常に意義のあることだと思います。ネットには、特に海外の情報について誤訳や勘違いが修正されぬまま拡散することが多々あり、それがネット全体を批判する根拠にもなっていますので、このアップデートが、情報流通の質の改善に繋がることを期待したいですね。