Skip to content

Instantly share code, notes, and snippets.

@behitek
Created July 11, 2023 04:47
Show Gist options
  • Save behitek/d0b837ef0f49e29395af9dd7963875d3 to your computer and use it in GitHub Desktop.
Save behitek/d0b837ef0f49e29395af9dd7963875d3 to your computer and use it in GitHub Desktop.
Audio path : common_voice_ja_21409740.mp3
Reference : 祖母は、おおむね機嫌よく、サイコロをころがしている。
Original model : ほぼ思い切りにおけさえコロコロはしている。
Finetuned model: 祖母 は おもい 機嫌 よく サイコロコロ か し て いる
OpenAI model : ほぼ思い切りによってサイコロころがしている。
Audio path : common_voice_ja_22072759.mp3
Reference : 財布をなくしたので、交番へ行きます。
Original model : 財布をなくしたので交番へ行きます。
Finetuned model: 財布 を なくし た の て 交番 て 行き ます
OpenAI model : 財布をなくしたので、小金へ行きます。
Audio path : common_voice_ja_23677003.mp3
Reference : 背の高さは一七〇センチほどで、目が大きく、やや太っている。
Original model : 背の高さは170センチほどで、目が大きくやや太っている。
Finetuned model: 背 の 高 さ は 百 七十 センチ ほと て 目 か 大きく やや 太っ て いる
OpenAI model : 背の高さは170センチほどで、目が大きくやや太っている。
Audio path : common_voice_ja_19499629.mp3
Reference : 新しい靴をはいて出かけます。
Original model : 新しい靴を履いています。
Finetuned model: 新しい 靴 を 履い て 出かけ ます
OpenAI model : 新しい靴を履いて出かけます。
Audio path : common_voice_ja_30615849.mp3
Reference : 家族といえども言葉で伝えるのは大事
Original model : 家族といえども、言葉で伝えるのは大事。
Finetuned model: 家族 と いえ と も 言葉 て 伝える の は 大事
OpenAI model : 家族といえども、言葉で伝えるのは大事。
Audio path : common_voice_ja_22717324.mp3
Reference : 松井さんはサッカーより野球のほうが上手です。
Original model : 松井さんはサッカーより野球の方が上手です。
Finetuned model: 松井 さん は サッカ より 野球 の ほう か 上手 てす
OpenAI model : 松井さんはサッカーより野球の方が上手です。
Audio path : common_voice_ja_28519138.mp3
Reference : 今はそんなに安くもない
Original model : 今はそんなに安くもない。
Finetuned model: 今 は そんな に 安く も ない
OpenAI model : 今はそんなに安くもない。
Audio path : common_voice_ja_28789641.mp3
Reference : 女の子と仲良くしているとからかわれる年齢だった。
Original model : 女の子と仲良くしていると、からかわれる年齢だった。
Finetuned model: 女の子 と 仲良く し て いる と カラハ れる 年齢 たっ た
OpenAI model : 女の子と仲良くしていると払われる年齢だった。
Audio path : common_voice_ja_22011991.mp3
Reference : 新しいお皿を使います。
Original model : 新しいお皿を使います。
Finetuned model: 新しい お 皿 を 使い ます
OpenAI model : 新しいお皿を使います。
Audio path : common_voice_ja_23508524.mp3
Reference : 結婚以来三年半ぶりの東京も、旧友とのお酒も、夜行列車も、駅で寝て、朝を待つのも久しぶりだ。
Original model : 結婚以来3年半ぶりの東京も、キュートなお酒も夜行列車も、駅で寝て朝を待つのも久しぶりだ。
Finetuned model: 結婚 以来 三 年 半 ふり の 東京 も 急 油田 の お 酒 も 夜行 列車 も 駅 て 寝 て 朝 を 待つ の も 久し ふり た
OpenAI model : 結婚以来3年半ぶりの東京も、急いだお酒も、夜行列車も、駅で寝て朝を待つのも久しぶりだ。
Audio path : common_voice_ja_23555409.mp3
Reference : これまで、少年野球、ママさんバレーなど、地域スポーツを支え、市民に密着してきたのは、無数のボランティアだった。
Original model : これまで少年野球、ママさんバレーなど地域スポーツを支え、市民に密着してきたのは無数のボランティアだった。
Finetuned model: これ まて 少年 野球 ハマサン ハレ なと 地域 スホ ツ を 支え 市民 に 密着 し て き た の は 無数 の ホランティア たっ た
OpenAI model : これまで少年野球、ママサンバレーなど地域スポーツを支え、市民に密着してきたのは無数のボランティアだった。
Audio path : common_voice_ja_22155958.mp3
Reference : 靴を脱いで、スリッパをはきます。
Original model : 靴を脱いでスリッパを履きます。
Finetuned model: 靴 を 脱い て スリッハ を 履き ます
OpenAI model : 靴を脱いでスリッパを履きます。
Audio path : common_voice_ja_21685815.mp3
Reference : この部屋の壁は薄いので、小さい声で話します。
Original model : この部屋の壁は薄いので、小さい声で話します。
Finetuned model: この 部屋 の 壁 は 薄色 て 小さい 声 て 話し ます
OpenAI model : この部屋の壁は薄いので、小さい声で話します。
Audio path : common_voice_ja_33819276.mp3
Reference : そうして脅迫めいた響きを感じさせる言葉は、無かったのです
Original model : そうせ、脅迫めいた響きを感じさせる言葉はなかったのです。
Finetuned model: そう し て 脅迫 め に た 響き を 感し させる こと は は なかっ た の てす
OpenAI model : そうせ、強迫鳴いた響きを感じさせる言葉は無かったのです。
Audio path : common_voice_ja_22786055.mp3
Reference : 自分の好きなジャズピアニストの演奏への、震えるような感動を綴る人もいた。
Original model : 自分の好きなジャズピアニストの演奏への震えるような感動を綴る人もいた。
Finetuned model: 自分 の 好き な シャス ヒアニスト の 演奏 へ の 震える よう な 感動 を 綴る 人 も い た
OpenAI model : 自分の好きなジャズピアニストの演奏への震えるような感動を綴る人もいた。
Audio path : common_voice_ja_21802310.mp3
Reference : あそこに小さい女の子がいます。
Original model : そこに小さなもの箱があります。
Finetuned model: そこ に 小さな 女の子 か い ます
OpenAI model : ここに小さな斧箱があります。
Audio path : common_voice_ja_21358328.mp3
Reference : 妹がまだ帰らないので、母は心配しています。
Original model : 妹がまだ帰らないので母は心配しています。
Finetuned model: 妹 か また 帰ら ない の て 母 は 心配 し て い ます
OpenAI model : 妹がまだ帰らないので母は心配しています。
Audio path : common_voice_ja_23702137.mp3
Reference : デビューウェイトはスーパーバンタム級ではなくフェザー級だった
Original model : デビューウェイトはスーパーバンダム級ではなくフェザー級だった。
Finetuned model: テヒュ ウェイト は ス ハ ハンタム 球 て は なく フェタ 球 たっ た
OpenAI model : デビューウェイトはスーパーバンダム級ではなくフェザー級だった。
Audio path : common_voice_ja_26075572.mp3
Reference : 常に「ヒュー・ジョン」として知られています。
Original model : 常にフュージョンとして知られています。
Finetuned model: つね に ヒュ ション と し て 知ら れ て い ます
OpenAI model : 常にフュージョンとして知られています。
Audio path : common_voice_ja_25685038.mp3
Reference : 素晴らしい!ありがとう
Original model : 素晴らしい。ありがと。
Finetuned model: 素晴らしい ありかとう
OpenAI model : 素晴らしい。ありがと。
Audio path : common_voice_ja_23237855.mp3
Reference : ペンシルベニア州フィラデルフィアの郊外ウィンウッドのランケナウ病院で生まれた
Original model : フェンシルベニア州フィラデルフィアの郊外ウィンウッドのランケナウ病院で生まれた。
Finetuned model: フェンシルヘニア 州 フィラテルフィア の 郊外 ウィン ウット の ラン ケナウ 病院 て 生まれ た
OpenAI model : フェンシルベニア州フィラデルフィアの郊外ウィンウッドのランケナウ病院で生まれた。
Audio path : common_voice_ja_21705307.mp3
Reference : 次の角を右に曲がります。
Original model : 次の角を右に曲がります。
Finetuned model: 次 の 角 を 右 に 曲かり ます
OpenAI model : 次の角を右に曲がります。
Audio path : common_voice_ja_22219505.mp3
Reference : はち
Original model :
Finetuned model: 八 七 六 五 六 七 八 九 十 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 二 ヤ ヤ ヤ ヤ ヤ ヤ ヤ ヤ ヤ ヤ
OpenAI model : 8
Audio path : common_voice_ja_34386693.mp3
Reference : イタリアの首都はローマである
Original model : イタリアの使徒はローマである。
Finetuned model: イタリア の 首都 は ロ マ て ある
OpenAI model : イタリアの使徒はローマである。
Audio path : common_voice_ja_23673936.mp3
Reference : いま人間に必要なのは、自分さえよければいい、という、欲望や、狭い心ではありません。
Original model : 今、人間に必要なのは、自分さえ生ければいい、という欲望や狭い心ではありません。
Finetuned model: 今 人間 に 必要 な の は 自分 さえ 行けれ は いい と いう 欲望 や 狭い 心 て は あり ませ ん
OpenAI model : 今、人間に必要なのは、自分さえ生ければいいという欲望や狭い心ではありません。
Audio path : common_voice_ja_21593940.mp3
Reference : コンピューターのスイッチを入れます。
Original model : コンピューターのスイッチを入れます。
Finetuned model: コン ヒュ タ の スイッチ を 入れ ます
OpenAI model : コンピューターのスイッチを入れます。
Audio path : common_voice_ja_19547304.mp3
Reference : 目が悪いので、眼鏡をかけます。
Original model : 目が悪いので、眼鏡をかけます。
Finetuned model: 目 か 悪い の て ネカネ を かけ ます
OpenAI model : 目が悪いので、眼鏡をかけます。
Audio path : common_voice_ja_20650478.mp3
Reference : 外国語を勉強するのは難しいです。
Original model : 外国語を勉強するのは難しいです。
Finetuned model: 外国 語 を 勉強 する の は 難しい てす
OpenAI model : 外国語を勉強するのは難しいです。
Audio path : common_voice_ja_20289936.mp3
Reference : わたしは警官に名前を聞かれました。
Original model : 私は警官に名前を聞かれました。
Finetuned model: 私 は 警官 に 名前 を 聞か れ まし た
OpenAI model : 私は警官に名前を聞かれました。
Audio path : common_voice_ja_22307742.mp3
Reference : れい
Original model : えいっ
Finetuned model: え ヘイ
OpenAI model : へい!
Audio path : common_voice_ja_30310560.mp3
Reference : しかのみならず、我々の作為そのものが物の世界から起こる。
Original model : 鹿は飲みならず、我々の作為そのものが、ものの世界から起る。
Finetuned model: しか あのみ なら す 我々 の 作為 その もの か 各 の 世界 から 起こる
OpenAI model : 鹿は飲みならず、我々の作為そのものが、ものの世界から起る。
Audio path : common_voice_ja_23057326.mp3
Reference : 夕飯は毎日自分が作ります。
Original model : 夕飯は毎日自分が作ります
Finetuned model: 夕飯 は 毎日 自分 か 作り ます
OpenAI model : 夕飯は毎日自分が作ります
Audio path : common_voice_ja_30484464.mp3
Reference : 何言ってるか分からない
Original model : 何言ってるかわからない
Finetuned model: 何 言っ てる か わから ない
OpenAI model : 何言ってるかわからない。
Audio path : common_voice_ja_25171942.mp3
Reference : 先生の車はどこにありますか。
Original model : 先生の車はどこにありますか。
Finetuned model: 先生 の 車 は とこ に あり まし た
OpenAI model : 先生の車はどこにありますか。
Audio path : common_voice_ja_22075757.mp3
Reference : きのう教室にハンカチを忘れました。
Original model : 木の給室にハンカチを忘れました。
Finetuned model: きのう 休日 に 漢字 を 忘れ まし た
OpenAI model : 木の給室にハンカチを忘れました。
Audio path : common_voice_ja_21493990.mp3
Reference : いろいろありがとうございました。
Original model : ご協力ありがとうございました
Finetuned model: 色 を ありかとう こさい まし た
OpenAI model : ご協力ありがとうございました
Audio path : common_voice_ja_26342845.mp3
Reference : ツルンとした食感がやみつきになる
Original model : つるんとした食感が読みつきになる。
Finetuned model: スレント し た 食感 か 読み付き に なる
OpenAI model : つるんとした食感が読みつきになる。
Audio path : common_voice_ja_21810118.mp3
Reference : 先生の机の上に辞書が二冊と雑誌が一冊あります。
Original model : 先生の机の上に、辞書が二冊と雑誌が一冊あります。
Finetuned model: 先生 の 机 の 上 に 辞書 か 二 冊 と 雑誌 か 一 冊 あり ます
OpenAI model : 先生の机の上に、辞書が二冊と雑誌が一冊あります。
Audio path : common_voice_ja_22834892.mp3
Reference : 大声を出しすぎて、かすれ声になってしまう。
Original model : 大声を出しすぎてかすれ声になってしまう。
Finetuned model: 大声 を 出し すき て カスレ 声 に なっ て しまう
OpenAI model : 大声を出しすぎてかすれ声になってしまう。
Audio path : common_voice_ja_21573728.mp3
Reference : ラジオでニュースを聞きます。
Original model : ラジオでニュースを聞きます。
Finetuned model: ラシオ て ニュ ス を 聞き ます
OpenAI model : ラジオでニュースをお聞きします。
Audio path : common_voice_ja_27696032.mp3
Reference : 世界を創造的に把握するということでなければならない。
Original model : 世界を想像的に把握するということでなければならない。
Finetuned model: 世界 を 創造 的 に 把握 する と いう こと て なけれ は なら ない
OpenAI model : 世界を想像的に把握するということでなければならない。
Audio path : common_voice_ja_20933245.mp3
Reference : きのう初めてピアノを習いました。
Original model : 昨日初めてピアノを習いました。
Finetuned model: きのう 初めて ヒアノ を 狙い まし た
OpenAI model : 昨日初めてピアノを習いました。
Audio path : common_voice_ja_27777064.mp3
Reference : 暑くなってきたせいか、食品が痛むのが早い
Original model : 暑くなってきたせいか食品が痛むのが早い。
Finetuned model: 暑く なっ て き た せい か 食品 か 痛む の は 早い
OpenAI model : 暑くなってきたせいか、食品が痛むのが早い。
Audio path : common_voice_ja_19673792.mp3
Reference : もっと安い部屋を探そうと思います。
Original model : もっと安い部屋を探そうと思います。
Finetuned model: もっと 安い 部屋 を 探そう と 思い ます
OpenAI model : もっと安い部屋を探そうと思います。
Audio path : common_voice_ja_19676248.mp3
Reference : ぶらぶらと、球場まで十分足らずの道を歩いていく。
Original model : ぐらぐらと急中を待て、十分たらずの道を歩いて行く。
Finetuned model: ふらふら と 空中 まて 十分 たら す の 道 を 歩い て いく
OpenAI model : ぐらぐらと急中を待て、十分たらずの道を歩いて行く。
Audio path : common_voice_ja_19779200.mp3
Reference : あしたイさんに電話をします。
Original model : 明日イサンに電話をします。
Finetuned model: あした イサン に 電話 を し ます
OpenAI model : 明日イサンに電話をします。
Audio path : common_voice_ja_21935426.mp3
Reference : この意見に、宇宙人たちは、パチパチと、それぞれすべての手で拍手して賛成した。
Original model : この意見に宇宙人たちはパチパチと、それぞれ全ての手で拍手して賛成した。
Finetuned model: この 意見 に 宇宙 人 たち は はちはち と それそれ すへて の 手 て 拍手 し て 賛成 し た
OpenAI model : 周り県に宇宙人たちはパチパチと、それぞれ全ての手で拍手して賛成した。
Audio path : common_voice_ja_21506447.mp3
Reference : 限られた予算で仕事をする、美術スタッフの気持ちを、おしはかって我慢する。
Original model : 限られた予算で仕事をする美術スタッフの気持ちを押し量って我慢する。
Finetuned model: 限ら れ た 予算 て 仕事 を する 美術 スタッフ の 気持ち を 押し量っ て 我慢 する
OpenAI model : 限られた予算で仕事をする美術スタッフの気持ちを押し量って我慢する。
Audio path : common_voice_ja_21921351.mp3
Reference : その結果、雨が降れば、大量の表土、赤土、化学肥料、農薬が、海に流れだす。
Original model : 雨が降れば大量の強度、赤土、化学肥料、農薬が海に流れます。
Finetuned model: その 結果 雨 か 降れ は 大量 の 氷土 の 親子 か 海 に 流れ ます
OpenAI model : その結果、雨が降れば大量の氷土、赤土、化学肥料、農薬が海に流れます。
Audio path : common_voice_ja_34009693.mp3
Reference : 今日も暑いですね
Original model : 今日も暑いですね。
Finetuned model: きょう は もう 暑い てす ね
OpenAI model : 今日も暑いですね。
Audio path : common_voice_ja_22720529.mp3
Reference : あなたのお仕事は何ですか。
Original model : あなたのお仕事は何ですか?
Finetuned model: あなた の お 仕事 は 何 てす か
OpenAI model : あなたのお仕事は何ですか?
Audio path : common_voice_ja_20314951.mp3
Reference : このホテルの部屋はとてもきれいです。
Original model : このお寺のエアはとても綺麗です。
Finetuned model: この ホテル の 映画 は とても 綺麗 てす
OpenAI model : このお寺のエアはとても暑いです。
Audio path : common_voice_ja_29308746.mp3
Reference : 世界が歴史的であるということは、我々がホモ・ファーベルであるということである。
Original model : 世界が歴史的であるということは、我々がホモハーベルであるということである。
Finetuned model: 世界 か 歴史 的 て ある と いう こと は 我々 か ホモハ ヘル て ある と いう こと て ある
OpenAI model : 世界が歴史的であるということは、我々がホモハーベルであるということである。
Audio path : common_voice_ja_29308747.mp3
Reference : 情報を惜しみなく出してくれるから、だいぶやりやすくなった
Original model : 情報を惜しみなく出してくれるから、だいぶやりやすくなった。
Finetuned model: 情報 を お 気 に なく 出し て くれる から たいふ やり やすく なっ た
OpenAI model : 情報を惜しみなく出してくれるから、だいぶやりやすくなった。
Audio path : common_voice_ja_19523283.mp3
Reference : 空が少し曇ってきました。
Original model : 空が少し曇ってきました。
Finetuned model: 空 か 少し 曇っ て き まし た
OpenAI model : 空が少し曇ってきました。
Audio path : common_voice_ja_19523285.mp3
Reference : 英語で話すのは難しいです。
Original model : 英語で話すのは難しいです。
Finetuned model: 英語 て 話す の は 難しい てす
OpenAI model : 英語で話すのは難しいです。
Audio path : common_voice_ja_30240649.mp3
Reference : あそこのレストランは、オムライスが好き。子供の頃から変わらないんだよ!
Original model : あそこのレストランはオムライスが好き。子供の頃から変わらないんだよ。
Finetuned model: あそこ の レストラン は オムライス か 好き 子供 の ころ から 変わら ない ん た よ
OpenAI model : パソコンのレストランはオムライスが好き。子供の頃から変わらないんだよ。
Audio path : common_voice_ja_30240650.mp3
Reference : これからよろしく。
Original model : これからよろしく
Finetuned model: これ から よろしく
OpenAI model : これからよろしく
Audio path : common_voice_ja_32248839.mp3
Reference : 第三に常識は有機的な知識として社会における均衡の状態に相応するものであった。
Original model : 第三に常識は有機的な知識として、社会における均衡の状態に相応するものであった。
Finetuned model: 第 三 に 常識 は 有機 的 な 知識 と し て 社会 に おけ る 銀行 の 状態 に 相応 する もの て あっ た
OpenAI model : 第三に常識は有機的な知識として、社会における均衡の状態に相応するものであった。
Audio path : common_voice_ja_32248840.mp3
Reference : そこにはどこまでもミトス的に我々を抑圧するものを否定し行かねばならない。
Original model : そこにはどこまでも見通すてきに我々を抑圧するものを否定し行かねばならない。
Finetuned model: そこ に は とこ まて も 未 突的 に 我々 を 抑圧 する もの を 否定 し 行か ね は なら ない
OpenAI model : そこにはどこまでも未突的に我々を予感するものを否定し行かねばならない。
Audio path : common_voice_ja_22969191.mp3
Reference : 初めて、ルーブル美術館へ入ったのは、十四年前のことだ。
Original model : 初めてルーブル美術館へ入ったのは十四年前のことだ。
Finetuned model: 初めて ル フル 美術 館 へ 入っ た の は 十 四 年 前 の こと た
OpenAI model : 初めてルーブル美術館へ入ったのは十四年前のことだ。
Audio path : common_voice_ja_22969192.mp3
Reference : あの電話で外国に電話ができますか。
Original model : あの令和で外国に令和ができますか?」
Finetuned model: あの 電話 て 外国 に 電話 か てき ます か
OpenAI model : あの電話で外国に電話ができますか?」
Audio path : common_voice_ja_25205795.mp3
Reference : みんな、服やネクタイの色は、よく覚えている。
Original model : みんな、服やネクタイの色はよく覚えてる。
Finetuned model: みんな 服 や ネクタイ の 色 は よく 覚え てる
OpenAI model : みんな、服やネクタイの色はよく覚えてる。
Audio path : common_voice_ja_25205796.mp3
Reference : 今晩は友達のうちでごはんを食べます。
Original model : こんばんは、友達のうちで ごはんを食べます。
Finetuned model: 今晩は 友達 の うち て こはん を 食へ ます
OpenAI model : こんばんは、友達のうちでごはんを食べます。
Audio path : common_voice_ja_21090690.mp3
Reference : 危ないので、あそこの窓を開けてはいけません。
Original model : 危ないのであそこの窓を開けてはいけません。
Finetuned model: 危い の て あそこ の 窓 を 開け て は いけ ませ ん
OpenAI model : 危ないのであそこの窓を開けてはいけません。
Audio path : common_voice_ja_21090692.mp3
Reference : 半年、一年とつづくと、自分から願い出て、病院を移ることがあるという。
Original model : 半年、一年と続くと自分から値替えでて病院を移ることがあるという。
Finetuned model: 半年 一 年 と 続く と 自分 から 願い て て 病院 を 移る こと か ある と いう
OpenAI model : 半年、一年と続くと、自分から値替えでて病院を移ることがあるという。
Audio path : common_voice_ja_32423402.mp3
Reference : 今日はスライダーのキレがいいな
Original model : 今日はスライダーのキレがいいな。
Finetuned model: 今日 は スライタ の 綺麗 か いい な
OpenAI model : 今日はスライダーのキレがいいな。
Audio path : common_voice_ja_32423406.mp3
Reference : 全く知りません。
Original model : 全く知りません。
Finetuned model: まったく 知り ませ ん
OpenAI model : 全く知りません。
Audio path : common_voice_ja_25188638.mp3
Reference : きょうは寒くないです。
Original model : 今日は寒くないです。
Finetuned model: きょう は 寒く ない てす
OpenAI model : 今日は寒くないです。
Audio path : common_voice_ja_25188641.mp3
Reference : 先月わたしは会社をやめました。
Original model : 先月、私は会社を辞めました。
Finetuned model: 先月 私 は 会社 を 辞め まし た
OpenAI model : 先月、私は会社を辞めました。
Audio path : common_voice_ja_20661949.mp3
Reference : 明朝それが届いたら、腕におぼえのある連中を組んで、上陸用船艇で、あちら岸へ渡る。
Original model : 幼鳥それが届いたら、腕に覚えのあるレンチを組んで、上陸用船艇で八田岸へ渡る。
Finetuned model: 病情 それ か 届い たら 腕 に おこえ の ある 練習 を 組ん て 上陸 用 船底 て 八十 ら 岸 を 渡る
OpenAI model : 幼鳥それが届いたら、腕に覚えのある練習を組んで、上陸要選定で八田岸を渡る。
Audio path : common_voice_ja_20661951.mp3
Reference : 父の腕は、ただ彼をぐんぐん引っ張っていくだけだった。
Original model : 父の腕はただ彼をぐんぐん引っ張って行くだけだった。
Finetuned model: 父 の 腕 は たた 彼 を くんくん 引っ張っ て いく たけ たっ た
OpenAI model : 父の腕はただ彼をぐんぐん引っ張って行くだけだった。
Audio path : common_voice_ja_20307949.mp3
Reference : イさんからもらったお菓子を一個食べました。
Original model : イさんからもらったお菓子を一個食べました。
Finetuned model: イ さん から もらっ た お 菓子 を 一 個 食へ まし た
OpenAI model : イサンからもらったお菓子を一個食べました。
Audio path : common_voice_ja_20307951.mp3
Reference : この箱は縦が短くて、横が長いです。
Original model : この箱は縦が短くて横が長いです。
Finetuned model: この 箱 は 縦 か 短く て 横 か 長い てす
OpenAI model : この箱は縦が短くて横が長いです。
Audio path : common_voice_ja_22967337.mp3
Reference : 先生から質問を出しました。
Original model : 先生から質問を出しました。
Finetuned model: 先生 から 質問 を 出し まし た
OpenAI model : 先生から質問を出しました。
Audio path : common_voice_ja_22967341.mp3
Reference : このカメラは高いですが、とても便利です。
Original model : このカメラは高いですが、とても便利です。
Finetuned model: この カメラ は 高い てす か とても 便利 てす
OpenAI model : このカメラは高いですが、とても便利です。
Audio path : common_voice_ja_20472567.mp3
Reference : ここに物を置いてはいけません。
Original model : ここに物を置いてはいけません。
Finetuned model: そこ に 物 を 置い て は いけ ませ ん
OpenAI model : ここに物を置いてはいけません。
Audio path : common_voice_ja_20472569.mp3
Reference : 海外で働きたいと思っているんです。
Original model : 大会で働きたいと思っているのです。
Finetuned model: 大会 て 働き たい と 思っ て いる の てす
OpenAI model : 大会で働きたいと思っているのです。
Audio path : common_voice_ja_27695355.mp3
Reference : この故にそれはどこまでも種的形成でありながら、
Original model : このゆえに、それはどこまでも、主的形勢でありながら、
Finetuned model: この 故 に それ は とこ まて も 種 的 形成 て あり なから
OpenAI model : このゆえに、それはどこまでも主的形勢でありながら、
Audio path : common_voice_ja_27695356.mp3
Reference : 全然、写真と違うじゃないですかあ
Original model : ぜんぜん写真と違うじゃないですか
Finetuned model: せんせん 写真 と 違う しゃ ない てす か
OpenAI model : 全然、写真と違うじゃないですか。
Audio path : common_voice_ja_30480833.mp3
Reference : パッケージを見て即買い
Original model : パッケージを見て食材
Finetuned model: ハッケ シ を 見 て 食買い
OpenAI model : パッケージを見て食材
Audio path : common_voice_ja_30481025.mp3
Reference : 種によって個が生き、個によって種が生きるかぎり、種の生命であるのである。
Original model : 主によって子が生き、子によって主が生きる限り、主の生命であるのである。
Finetuned model: 種 に よっ て 子 か 生き 子 に よっ て 種 か 生きる かきり 種 の 生命 て ある の て ある
OpenAI model : 主によって子が生き、子によって主が生きる限り、主の生命であるのである。
Audio path : common_voice_ja_24332450.mp3
Reference : 本はかばんの中です。
Original model : 本はスパムの中です。
Finetuned model: 本 は スハウナナカ てす
OpenAI model : 本はスパムの中です。
Audio path : common_voice_ja_24332452.mp3
Reference : あしたは早く会社へ行きます。
Original model : 明日は早く会社へ行きます
Finetuned model: あした は 早く 会社 へ 行き ます
OpenAI model : 明日は早く会社へ行きます。
Audio path : common_voice_ja_27697705.mp3
Reference : 行為的直観的現実をヒポケーメノンとして種々なる判断が成立する。
Original model : 好意的直感的現実を、貴方系面論として主処なる判断が成立する。
Finetuned model: 行為 的 直観 的 現実 を ヒホ 系 面論 と し て 種々 なる 判断 か 成立 する
OpenAI model : 好意的・直感的現実を、貴方系面論として主処なる判断が成立する。
Audio path : common_voice_ja_27697706.mp3
Reference : 眠たくなるのが早くなった
Original model : 眠たくなるのが早くなった。
Finetuned model: 眠たく なる の か 早く なっ た
OpenAI model : 眠たくなるのが早くなった。
Audio path : common_voice_ja_30545966.mp3
Reference : いやいや、そうはならないだろ
Original model : いやいや、そうはならないだろう。
Finetuned model: いやいや そう は なら ない たろ
OpenAI model : いやいや、そうはならないだろう。
Audio path : common_voice_ja_30545969.mp3
Reference : 専門家だけど当たり前のことしか言ってない
Original model : 専門家だけど当たり前のことしか言っていない。
Finetuned model: 専門 家 た けと 当たり前 の こと しか 言っ て い ない
OpenAI model : 専門家だけど当たり前のことしか言っていない。
Audio path : common_voice_ja_21553713.mp3
Reference : 台風で電車が遅れました。
Original model : 台風で電車がおこれました。
Finetuned model: 台風 て 電車 か 遅れ まし た
OpenAI model : 台風で電車が遅れました。
Audio path : common_voice_ja_21553717.mp3
Reference : 辞書を見て、日本語を勉強します。
Original model : 辞書を見て日本語を勉強します。
Finetuned model: 辞書 を 見 て 日本 語 を 勉強 し ます
OpenAI model : 辞書を見て、日本語を勉強します。
Audio path : common_voice_ja_30611779.mp3
Reference : この子は、たいして役にもたちませんでした。
Original model : この子は大して役にも立ちませでした。
Finetuned model: この 校 は たいして 役 に も 立ち ませ ん てし た
OpenAI model : この子は大して役にも立ちませでした。
Audio path : common_voice_ja_30611780.mp3
Reference : それが過去から未来へと動き行くということである。
Original model : それが過去から未来へと動き行くということである。
Finetuned model: それ か 過去 から 未来 へ と 動き 行く と いう こと て ある
OpenAI model : それが過去から未来へと動き行くという事である。
Audio path : common_voice_ja_21789623.mp3
Reference : 私は、いろいろの弁護を、自分の胸でこしらえてみました。
Original model : 私はいろいろの弁護を自分の腕でこしらえてみました。
Finetuned model: 私 は いろいろ の 弁護 を 自分 の 腕 て 擦ら れ て み まし た
OpenAI model : 私は色々の弁護を自分の腕でこしらえてみました。
Audio path : common_voice_ja_21789627.mp3
Reference : これは体に悪い食べ物です。
Original model : これは体に悪い食べ物です。
Finetuned model: これ は 体 に 割り食へ もの てす
OpenAI model : これは体に悪い食べ物です。
Audio path : common_voice_ja_28652301.mp3
Reference : そのアイスもいつも買っていたから。
Original model : そのアイスもいつも買っていたから。
Finetuned model: その アイス も いつ も 買っ て い た から
OpenAI model : そのアイスもいつも買っていたから。
Audio path : common_voice_ja_28652312.mp3
Reference : そうなるとあとは時間の問題だった。
Original model : そうなると、あとは時間の問題だった。
Finetuned model: そう なる と あと は 実感 の 問題 たっ た
OpenAI model : そうなると、あとは実感の問題だった。
Audio path : common_voice_ja_23645994.mp3
Reference : 実習中は、雪が降っていたけれど、ほっぺの痛さも、もう、味わえなくなるかと思うと、全然、平気だった。
Original model : 実習中は雪が降っていたけれど、ほっぺの痛さも、もう味わえなくなるかと思うと全然平気だった。
Finetuned model: 実習 中 は 雪 か 降っ て い た けれと ほっへ の 痛 さ も もう 味わえ なく なる か と 思う と 全然 平気 たっ た
OpenAI model : 実習中は雪が降っていたけれど、ほっぺの痛さも、もう味わえなくなるかと思うと、全然平気だった。
Audio path : common_voice_ja_23645995.mp3
Reference : このときペリメーデーはアムピクトリュオーンに同行してテーバイに来ていたリキュムニオスに妻としてあたえられた
Original model : このときペリメーデーはアムピクトリオーンに同行して定売に来ていたり、リキューニーオスに妻として訴えられた。
Finetuned model: この とき ヘリメ テ は アム ヒクトリオ ン に 同行 し て テ ハイ に 来 て い た リキュ ニ オス に 妻 と し て 訴え られ た
OpenAI model : このときペリメーデーは、アムピクトリオーンに同行して定売に来ていたリキューニーオスに妻として訴えられた。
Audio path : common_voice_ja_20527817.mp3
Reference : きょうかぜで学校を休みました。
Original model : 今日、風邪で学校を休みました。
Finetuned model: きょう 風 て 学校 を 休み まし た
OpenAI model : 今日、風邪で学校を休みました。
Audio path : common_voice_ja_20527819.mp3
Reference : いいえ、できません。
Original model : いいえ、できません。
Finetuned model: いいえ てき ませ ん
OpenAI model : いいえ、できません。
Original model WER: 0.81, CER: 0.16
Finetuned model WER: 9.71, CER: 2.54
OpenAI model WER: 0.81, CER: 0.15
import json
import os
from datasets import load_dataset, Audio
from transformers import WhisperForConditionalGeneration, WhisperProcessor
import torch
from evaluate import load
# Load the Japanese Common Voice 11 dataset
ja_common_voice = load_dataset(
"mozilla-foundation/common_voice_11_0", "ja", split="test"
)
ja_common_voice = ja_common_voice.cast_column("audio", Audio(sampling_rate=16_000))
# take first 100 samples
ja_common_voice = ja_common_voice.select(range(100))
print("Number of samples:", len(ja_common_voice), "\n")
# I am using git lfs to download your model to local folder
model_dir = "./whisper-large-v2-jp/"
processor = WhisperProcessor.from_pretrained(model_dir)
model = WhisperForConditionalGeneration.from_pretrained(model_dir).to("cuda")
def map_to_pred(batch):
audio = batch["audio"]
input_features = processor(
audio["array"], sampling_rate=audio["sampling_rate"], return_tensors="pt"
).input_features
batch["reference"] = processor.tokenizer._normalize(batch["sentence"])
with torch.no_grad():
predicted_ids = model.generate(input_features.to("cuda"))[0]
transcription = processor.decode(predicted_ids)
batch["prediction"] = processor.tokenizer._normalize(transcription)
return batch
result = ja_common_voice.map(map_to_pred)
output_path = os.path.join(
os.path.dirname(__file__), "../results/finetuned_model_result.json"
)
os.makedirs(os.path.dirname(output_path), exist_ok=True)
with open(output_path, "w") as f:
json.dump(
{
"reference": result["reference"],
"prediction": result["prediction"],
"path": [os.path.basename(x) for x in result["path"]],
},
f,
ensure_ascii=False,
indent=4,
)
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment