Twitterからツイートを取得し、Googleデータポータルで分析をしたりする際、ツイートの言語が言語コードとして取得できますが、それを日本語に変換する方法を紹介します。
Twitterの言語コード一覧
Twitterの言語コードは143もあります。
通常の言語コード以外に”und”というものがありますが、ツイート内容が写真だけなど判別出来ない場合などが”und”になるようです。
言語コードはこちらの記事を参考にしました。
Twitterの言語コード一覧を日本語にする
Googleデータポータルのデータソースで取得したTwitterの言語コードを新しいフィールドで日本語に変換します。
Twitterから取得した言語コードは”TweetLanguageCode”というカラムに入れています。実際に使う際には”TweetLanguageCode”を、ご自身で指定したカラム名に置き換えてください。
新しいフィールドを追加し、下のコードで日本語に変換します。
code
CASE TweetLanguageCode WHEN "und" THEN "不明" WHEN "en" THEN "英語" WHEN "is" THEN "アイスランド語" WHEN "ay" THEN "アイマラ語" WHEN "ga" THEN "アイルランド語" WHEN "az" THEN "アゼルバイジェン語" WHEN "as" THEN "アッサム語" WHEN "aa" THEN "アファル語" WHEN "ab" THEN "アプハジア語" WHEN "af" THEN "アフリカーンス語" WHEN "am" THEN "アムハラ語" WHEN "ar" THEN "アラビア語" WHEN "sq" THEN "アルバニア語" WHEN "hy" THEN "アルメニア語" WHEN "it" THEN "イタリア語" WHEN "yi" THEN "イディッシュ語" WHEN "iu" THEN "イヌクティトット語" WHEN "ik" THEN "イヌピア語" WHEN "ia" THEN "インターリングア" WHEN "ie" THEN "インターリング語" WHEN "in" THEN "インドネシア語" WHEN "ug" THEN "ウイグル語" WHEN "cy" THEN "ウェールズ語" WHEN "vo" THEN "ヴォラピュック語" WHEN "wo" THEN "ウォロフ語" WHEN "uk" THEN "ウクライナ語" WHEN "uz" THEN "ウズベク語" WHEN "ur" THEN "ウルドゥー語" WHEN "et" THEN "エストニア語" WHEN "eo" THEN "エスペラント語" WHEN "or" THEN "オーリア語" WHEN "oc" THEN "オキタン語" WHEN "nl" THEN "オランダ語" WHEN "om" THEN "オロモ語" WHEN "kk" THEN "カザフ語" WHEN "ks" THEN "カシミール語" WHEN "ca" THEN "カタラン語" WHEN "gl" THEN "ガリシア語" WHEN "ko" THEN "韓国語" WHEN "kn" THEN "カンナダ語" WHEN "km" THEN "カンボジア語" WHEN "rw" THEN "キヤーワンダ語" WHEN "el" THEN "ギリシャ語" WHEN "ky" THEN "キルギス語" WHEN "rn" THEN "キルンディ語" WHEN "gn" THEN "グアラニー語" WHEN "qu" THEN "クエチュア語" WHEN "gu" THEN "グジャラト語" WHEN "kl" THEN "グリーンランド語" WHEN "ku" THEN "クルド語" WHEN "ckb" THEN "中央クルド語" WHEN "hr" THEN "クロアチア語" WHEN "gd" THEN "ゲーリック語" WHEN "gv" THEN "ゲーリック語" WHEN "xh" THEN "コーサ語" WHEN "co" THEN "コルシカ語" WHEN "sm" THEN "サモア語" WHEN "sg" THEN "サングホ語" WHEN "sa" THEN "サンスクリット語" WHEN "ss" THEN "シスワティ語" WHEN "jv" THEN "ジャワ語" WHEN "ka" THEN "ジョージア語" WHEN "sn" THEN "ショナ語" WHEN "sd" THEN "シンド語" WHEN "si" THEN "シンハラ語" WHEN "sv" THEN "スウェーデン語" WHEN "su" THEN "スーダン語" WHEN "zu" THEN "ズールー語" WHEN "es" THEN "スペイン語" WHEN "sk" THEN "スロヴァキア語" WHEN "sl" THEN "スロヴェニア語" WHEN "sw" THEN "スワヒリ語" WHEN "tn" THEN "セツワナ語" WHEN "st" THEN "セト語" WHEN "sr" THEN "セルビア語" WHEN "sh" THEN "セルボクロアチア語" WHEN "so" THEN "ソマリ語" WHEN "th" THEN "タイ語" WHEN "tl" THEN "タガログ語" WHEN "tg" THEN "タジク語" WHEN "tt" THEN "タタール語" WHEN "ta" THEN "タミル語" WHEN "cs" THEN "チェコ語" WHEN "ti" THEN "チグリニャ語" WHEN "bo" THEN "チベット語" WHEN "zh" THEN "中国語" WHEN "ts" THEN "ヅォンガ語" WHEN "te" THEN "テルグ語" WHEN "da" THEN "デンマーク 語" WHEN "de" THEN "ドイツ語" WHEN "tw" THEN "トウィ語" WHEN "tk" THEN "トルクメン語" WHEN "tr" THEN "トルコ語" WHEN "to" THEN "トンガ語" WHEN "na" THEN "ナウル語" WHEN "ja" THEN "日本語" WHEN "ne" THEN "ネパール語" WHEN "no" THEN "ノルウェー語" WHEN "ht" THEN "ハイチ語" WHEN "ha" THEN "ハウサ語" WHEN "be" THEN "白ロシア語" WHEN "ba" THEN "バシキール語" WHEN "ps" THEN "パシト語" WHEN "eu" THEN "バスク語" WHEN "hu" THEN "ハンガリー語" WHEN "pa" THEN "パンジャビ語" WHEN "bi" THEN "ビスラマ語" WHEN "bh" THEN "ビハール語" WHEN "my" THEN "ビルマ語" WHEN "hi" THEN "ヒンディー語" WHEN "fj" THEN "フィジー語" WHEN "fi" THEN "フィンランド語" WHEN "dz" THEN "ブータン語" WHEN "fo" THEN "フェロー語" WHEN "fr" THEN "フランス語" WHEN "fy" THEN "フリジア語" WHEN "bg" THEN "ブルガリア語" WHEN "br" THEN "ブルターニュ語" WHEN "vi" THEN "ベトナム語" WHEN "iw" THEN "ヘブライ語" WHEN "fa" THEN "ペルシャ語" WHEN "bn" THEN "ベンガル語" WHEN "pl" THEN "ポーランド語" WHEN "pt" THEN "ポルトガル語" WHEN "mi" THEN "マオリ語" WHEN "mk" THEN "マカドニア語" WHEN "mg" THEN "マダガスカル語" WHEN "mr" THEN "マラッタ語" WHEN "ml" THEN "マラヤーラム語" WHEN "mt" THEN "マルタ語" WHEN "ms" THEN "マレー語" WHEN "mo" THEN "モルダビア語" WHEN "mn" THEN "モンゴル語" WHEN "yo" THEN "ヨルバ語" WHEN "lo" THEN "ラオタ語" WHEN "la" THEN "ラテン語" WHEN "lv" THEN "ラトビア語" WHEN "lt" THEN "リトアニア語" WHEN "ln" THEN "リンガラ語" WHEN "li" THEN "リンブルク語" WHEN "ro" THEN "ルーマニア語" WHEN "rm" THEN "レートロマンス語" WHEN "ru" THEN "ロシア語" ELSE TweetLanguageCode
END