Nothingスマホで『オフライン文字起こし』をする方法。実機で精度と使い勝手を検証

記事には広告が含まれます。本内容は公開時の情報です。

この記事に書いてある内容

広がる文字起こし機能と『プライバシー』の課題

昨今、スマートフォン(ミドル〜ハイエンド)の標準機能として『録音文字起こし』が搭載されつつあります。しかし、その多くは音声データをクラウドに送信して処理する仕組みです。機密性の高い議事録などを作成する場合、データの取り扱いには細心の注意を払わなければなりません。

そこで注目したいのが、端末内で処理を完結させる『オンデバイス(オフライン)文字起こし』です。

この分野の代表格といえばGoogleの『Pixel』シリーズ。精度が非常に高く、『音声と文字データが同期』するなど使い勝手もワンランク上。文字起こし機能を多用する方には、間違いなくイチオシな選択肢です。

意外?Nothingスマホでも『オフライン文字起こし』が可能

もう一つ、意外な『オフライン文字起こし対応デバイス』としてご紹介したいのが、Nothingのスマートフォン(Essentialキー搭載モデル)。Nothing製端末がオフライン文字起こしに対応しているという事実は、意外と知られていないのではないでしょうか。

録音データを端末内で解析して文字を出力する仕様(端末によって処理速度は若干異なる)。『文字と音声が同期していない』『読みやすさ』『精度』など、現時点では『Pixelに劣っているな』と感じます(あくまで『オフラインで文字起こし出来る機能がある』程度の認識がちょうど良い)。

音声メモの処理中画面(「処理中です。コンテンツの準備が整ったらお知らせします。」/再生ボタン/長さ00:58)

Essentialキー搭載モデル一覧

  • Nothing Phone (3)
  • Nothing Phone (3a) / (3a) Pro
  • Nothing Phone (4a)
  • CMF Phone 2 Pro

Nothing端末で可能な『2種類』の文字起こし

Pixelシリーズでは『レコーダー』アプリで自動的に文字起こしが行われますが、Nothingの場合は以下の2種類。

1. Essentialスペースによる解析(オンライン)

音声データを『Essentialスペース』に送り、『AI分析を開始する』をタップして解析する手法です。Nothing以外の端末で録音したデータも扱えるメリットがありますが、インターネット接続が必須。『オフラインで完結させたい』という目的には適しません。

また、内容を逐一文字にするのではなく、『概要』や『主なトピック』を自動振り分けする『音声の補足データ』を生成する仕組みです。そのため、詳細な議事録作成には不向きと言えるでしょう。

2. Essentialキーによるオフライン文字起こし

こちらが今回の『本命』です。物理ボタンである『Essentialキー』を使用します。 当初、私は『キーを長押ししている間だけオフラインで文字起こしされる』という方法しか知りませんでした。しかし、ボタンを押し続けるのは指が疲れますし、これではあくまで『即席の音声メモ』という位置付けでした。

アップデートで進化?『押しっぱなし不要』の録音方法

ところが、Essentialキーを使った録音文字起こしには『もう一種類』の方法が用意されていました(おそらくいつかのアップデートで追加された)。

この方法を使えば、キーを押し続けなくても『録音 + オフライン文字起こし』を継続することが可能です。ここからは、その具体的な設定・操作手順を解説していきます。

楽天モバイル 広告バナー

Nothingスマホで「オフライン文字起こし」を行う手順(画像付き)

オフライン文字起こしの具体的な手順と注意点

Nothingスマホでオフライン文字起こしを最大限活用するためには、いくつかの事前準備が必要です。

ネットワークが繋がった時点でEssentialスペース内のデータは同期される可能性があるので、オフラインのまま『間違っている箇所を音声を聞きながら修正→文字を全選択→コピー→オフライン対応のメモアプリ(ColorNoteなど)に貼り付けて保存→Essentialスペースのデータは削除』といった流れがベストです。

1. 事前準備:録音の制限と環境設定

録音時間は最大10分間です。『短い』と感じるかもしれませんが、データが膨大になると処理エラーのリスクが高まります。重要な録音ほど、分割して処理するのが無難な運用と言えるでしょう。

また、今回は『オフラインでの完結』が目的ですので、以下の設定を行ってください。

ネットワーク遮断

『機内モード』をONにし、Wi-Fiも切断します。

Nothingスマホのクイック設定パネル(機内モード/スクリーンレコード/アラーム)

画面の点灯維持

録音中は画面を点灯させる必要があるため、『設定』→『ディスプレイ』→『画面自動消灯』から、時間を『10分』または『30分』に延長しておきましょう。

画面自動消灯(スリープ)時間の設定画面(15秒〜30分)

節電対策

消費電力が気になる場合は、画面の明るさを手動で『暗め』に設定してください。

Nothing OSのクイック設定と明るさスライダー

2. 操作手順:Essentialキーを起点に録音開始

準備が整ったら、以下の手順で録音を開始します。

1.画面が点灯した状態で、本体側面の『Essentialキー』を短く押す

Nothingスマホ側面の物理ボタン(Essentialキー)を指で操作している様子(近接写真)

2.画面下部に表示される『メモを追加』の左側にある『マイクアイコン』をタップ

メモ入力画面でマイクボタンを選択して音声入力(録音)を開始する手順

3.録音がスタート。最大10分間のオフライン文字起こしが可能

録音中の音声メモ画面(波形表示と録音時間)

ネットワークが繋がった時点でEssentialスペース内のデータは同期される可能性があるので、オフラインのまま『間違っている箇所を音声を聞きながら修正→文字を全選択→コピー→オフライン対応のメモアプリ(ColorNoteなど)に貼り付けて保存→Essentialスペースのデータは削除』といった流れがベストです。

実機検証:Nothing『Phone(3a)Lite』『Phone(3a)』『Phone(3)』で「文字起こし精度」を比較

同じ音声(約1分40秒)を使い、『Nothing Phone(3a)Lite』『Nothing Phone(3a)』『Nothing Phone(3)』の3台で精度を検証しました(騒音の少ない静かな環境)。

オフライン文字起こし検証結果のまとめ

文字起こしの内容は『端末の性能』『処理の仕方』『録音環境』などによって異なる場合があります。

音声録音を文字起こしした結果(例文のトランスクリプト表示)
Nothing Phone(3a)Liteのオフライン文字起こし結果(8GB/128GBモデル)
別パターンの文字起こし結果(同じ音声のトランスクリプト表示)
Nothing Phone(3a)のオフライン文字起こし結果(8GB/128GBモデル)
文字起こし結果の全文表示(録音1分40秒のトランスクリプト)
Nothing Phone(3)のオフライン文字起こし結果(12GB/256GBモデル)
  1. Nothing Phone (3) 【最高】: 文脈を汲み取った正確な変換。
  2. Nothing Phone (3a) Lite 【良好】: 大枠は追えるが、同音異義語の誤字あり。
  3. Nothing Phone (3a) 【課題あり】: 数字の暴走や意味不明な変換が目立つ。

最上位モデルの 『Phone (3)』は、『客数(通になっている文脈で想定しやすい)×購入率』や『価値設計/動線設計」』といった専門的なビジネス用語も骨格が保たれ、そのまま文章として読めるレベルでした。

一方で 『Phone (3a) 』は、『アンパン』が『安判』になったり、数字が「1002」のように無関係な値に化けるなど、文脈補正の弱さが露呈しました。『Phone (3a) Lite』はその中間で、『動線→同戦』『反復→半復』といった音が近い誤変換が散見されます。

なぜ機種によって精度に差が出るのか?

オフライン文字起こしは、クラウド上の巨大なAIを使えないため、『端末側のスペック』が精度を直撃します。

メモリ(RAM)の影響

Phone (3a) 』『Phone (3a) Lite』はRAM 8GBモデルを使用。Phone (3)は唯一『12GB』を搭載しています。端末内で『音声のテキスト化』と『文脈補正』を同時に行うため、作業スペース(メモリ)に余裕がないと、システムが自動的に『軽いモデル(低精度モード)』に切り替えて処理を継続しようとするため、補正能力が落ちるのです。

【深掘り】Phone (3a) と Lite で起きた『精度の逆転現象』の理由

今回の検証で最も興味深かったのは、価格や処理能力で下位モデルにあたる Phone (3a) Lite が、上位の Phone (3a) よりも高い精度を記録した点です。

実際に録音された音声データを確認したところ、Phone (3a) はノイズ抑制処理(DSP)が強く効きすぎている印象を受けました(騒々しい場所ではプラスに作用する可能性あり)。その結果、人間が耳で聞く分には静かですが、AIにとっては『言葉の輪郭』がぼやけてしまい、聞き取りづらい音声(判別しにくいデータ)になっていたと考えられます。

対して Phone (3a) Lite は、処理が適度だったのか音の質が『聞き取りやすく』保たれていました。同じ音声を聞かせても、マイクの性能やSoC内での前処理のさじ加減ひとつで、最終的な文字起こし結果に差が出るのです。

結論:オフライン文字起こし(静かな環境)で選ぶならどのモデル?

Nothingスマホで精度の高い『オフライン文字起こし』を目指すなら、検証した中での選択肢は以下の通りです。

  1. 第1候補:Nothing Phone (3) (文脈補正まで含めて最も実用的)
  2. 第2候補:Nothing Phone (3a) Lite (意外にも (3a) より文字の崩れが少なく、大枠を捉えるには十分な性能)

今回の検証結果から見えた課題は、おそらくメーカー側も認識しているはず。次世代モデルとなる Phone (4a) では、ハードとソフトの両面でさらにブラッシュアップされた文字起こし体験ができることを期待しましょう!

関連リンク

Nothing

あわせて読みたい
Nothing Phone (3)レビュー|高性能『+α』なハイエンドスマホがココにあるこの記事に書いてある内容一覧 【Nothing Phone (3)の電池もち】は『やや良い』部類 YouTubeで同じ動画を約90分間再生して電池がどの程度減るか(実機検証結果) 屋外な...
あわせて読みたい
Nothing Phone(3a)レビュー|派手に見えて堅実なスマホ。カメラと音の良さ光るNothing Phone(3a)は、デザイン性と実用性を高いレベルで両立させたミドルクラスのスマートフォンです。スケルトンデザインは所有欲を刺激し、一目でNothingの端末と...
あわせて読みたい
Nothing Phone (3a) Liteで“トイデジ化”する方法|フィルム風LUT追加から撮り方までこの記事に書いてある内容 LUT(.cube)を作成する超簡単な方法。誰でも出来る! Nothing Phone (3a) LiteにLUT(.cube)をインポートする方法 Nothing Phone (3a) Lite...
あわせて読みたい
3万円台の画質とは?Nothing Phone (3a) Liteカメラ評価|写真・動画作例この記事に書いてある内容 Nothing Phone (3a) Liteの主なリアカメラ仕様 Nothing Phone (3a) Liteのカメラについて Nothing Phone (3a) Liteのカメラアプリは無駄を省...
あわせて読みたい
Nothing Phone (3a) Liteの『電池もち』『充電速度』を実機検証。お勧め充電器や『長持ち』対策も紹介この記事に書いてある内容 Nothing Phone (3a) LiteでYouTube動画(同じコンテンツ)を約90分間再生して電池がどの程度減るかを実機検証 Nothing Phone (3a) Liteで高負...
あわせて読みたい
Nothing Phone (3a) Lite(7300 Pro 5G)の性能は?AnTuTuなどベンチマーク実測この記事に書いてある内容 Nothing Phone (3a) Lite(Dimensity 7300 Pro 5G)のAnTuTu Benchmark実測結果(3回連続) Nothing Phone (3a) Lite(Dimensity 7300 Pro 5G...

楽天モバイル 広告バナー

瀬名 勇斗
運営者
サラリーマン時代は『製品開発(モバイルガジェット関連)』『広告(パッケージ及び説明書など)デザイン』『ディレクション』『マーケティング』『コピーライティング』などに従事。一つの製品に深く関わる事が好きで、開発から行っているメーカーに勤務していました。

ガジェット好きが高じて、一時は日本で発売されていないスマートフォンを海外から輸入。『Xiaomi』『OPPO』に関しては、日本参入前からフリークに。

元々写真を撮るのが趣味で、スマートフォンで撮影した作例を記事内に多数掲載。端末の性能を知りつつ、楽しんでいただければ幸いです。
  • URLをコピーしました!