Kotlinで文字列をパースする方法!正規表現で特定のデータを簡単抽出
生徒
「先生、Kotlinで文字列から特定の情報だけを取り出す方法はありますか?」
先生
「はい、Kotlinでは正規表現を使うと文字列の中から特定のパターンを簡単に抽出できます。」
生徒
「正規表現って聞いたことありますけど、難しいんじゃないですか?」
先生
「初めてだと少し複雑に感じますが、基本の形を覚えれば簡単です。今回は初心者でも分かるようにステップごとに解説します。」
1. Kotlinで文字列をパースするとは?
文字列をパースするとは、文章やデータの中から必要な情報だけを取り出すことを意味します。たとえば、メールアドレスや電話番号、日付など特定の形式を抽出したい場合に使います。KotlinではRegexクラスを使うと、簡単にパターンを指定して文字列を解析できます。
2. Kotlinの正規表現の基本
正規表現(Regular Expression)とは、「この形の文字列を探してください」というルールを文字で表したものです。例えば「数字だけを取り出す」場合は \\d+ と書きます。ここで \\d は数字、+ は1回以上繰り返すことを意味します。
fun main() {
val text = "今日の気温は25度です"
val regex = "\\d+".toRegex()
val result = regex.find(text)?.value
println(result)
}
25
このように、Regex.findを使うと、文字列の中で正規表現にマッチした部分を取得できます。
3. 複数のパターンを抽出する方法
文字列に複数の数字や特定の単語が含まれている場合、Regex.findAllを使うと全て取り出せます。
fun main() {
val text = "注文番号123と456と789があります"
val regex = "\\d+".toRegex()
val results = regex.findAll(text).map { it.value }.toList()
println(results)
}
[123, 456, 789]
これで、文章の中にあるすべての数字をリストとして取得できます。
4. Kotlinでメールアドレスを抽出する方法
例えば文章の中からメールアドレスを抜き出したい場合、正規表現でメールの形式を指定します。メールアドレスの一般的なパターンは「文字列@文字列.文字列」です。
fun main() {
val text = "お問い合わせはinfo@example.comまで"
val regex = "[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\\.[a-zA-Z]{2,}".toRegex()
val email = regex.find(text)?.value
println(email)
}
info@example.com
このように、メールアドレスだけを簡単に抽出できます。
5. Kotlinで文字列を分割してデータを取り出す
正規表現だけでなく、splitメソッドを使うと、文字列を区切り文字で分けることができます。たとえばカンマ区切りのリストからデータを抽出する場合です。
fun main() {
val csv = "りんご,みかん,バナナ"
val fruits = csv.split(",")
fruits.forEach { println(it) }
}
りんご
みかん
バナナ
この方法は、CSVファイルの解析や入力フォームのデータ処理などで非常に便利です。
6. Kotlinで文字列を置換しながら抽出する
正規表現は文字列の置換にも使えます。特定のパターンを別の文字列に変えたいときに便利です。
fun main() {
val text = "電話番号は090-1234-5678です"
val regex = "\\d{3}-\\d{4}-\\d{4}".toRegex()
val masked = text.replace(regex, "XXX-XXXX-XXXX")
println(masked)
}
電話番号はXXX-XXXX-XXXXです
この例では電話番号をマスクして表示しています。個人情報を隠す場合に役立つ方法です。
7. Kotlinで複雑なパターンを扱うコツ
複雑な文字列でも、正規表現を組み合わせることで抽出が可能です。ポイントはまず簡単なパターンから作り、少しずつ拡張することです。例えば日付を抽出したい場合は、\\d{4}-\\d{2}-\\d{2}のように表現します。
fun main() {
val text = "締切日は2026-03-20です"
val regex = "\\d{4}-\\d{2}-\\d{2}".toRegex()
val date = regex.find(text)?.value
println(date)
}
2026-03-20
このように、段階的にパターンを組み立てることで、初心者でも無理なく文字列をパースできます。
8. Kotlinで正規表現と組み合わせた便利なメソッド
Kotlinには正規表現と組み合わせて便利に使えるメソッドがいくつかあります。例えばmatchesは文字列全体がパターンに合致するか確認でき、containsMatchInは部分的に一致するかチェックできます。
fun main() {
val text = "test@example.com"
val regex = "[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\\.[a-zA-Z]{2,}".toRegex()
println(regex.matches(text))
println(regex.containsMatchIn("連絡先: test@example.com"))
}
true
true
このように、用途に応じて使い分けると、文字列処理の幅が広がります。
9. Kotlinで初心者が文字列パースを学ぶポイント
初心者の方は、まず簡単な数字や単語の抽出から始め、慣れてきたらメールアドレスや日付など少し複雑なパターンに挑戦するとよいです。また、正規表現を一度に全部覚える必要はありません。必要な部分だけを組み合わせるイメージで学習すると理解しやすくなります。
Kotlinを基礎からしっかり学びたい人や、 Java経験を活かしてモダンな言語にステップアップしたい人には、 定番の入門書がこちらです。
基礎からわかるKotlinをAmazonで見る※ Amazon広告リンク
まとめ
今回の記事では、Kotlinを使った文字列のパース方法について詳しく解説しました。文字列パースとは、文章やデータの中から必要な情報を抽出する操作であり、特定の数字や単語、メールアドレス、日付などを効率的に取り出す技術です。KotlinではRegexクラスを用いた正規表現やsplitメソッドを組み合わせることで、初心者でも簡単に文字列操作を行うことができます。特に、Regex.findで単一のパターンを取得し、Regex.findAllで複数の一致をリストとして取り出す方法は非常に便利です。
また、メールアドレスや電話番号の抽出では、正規表現でパターンを正確に指定することで、文章中から必要な情報だけを効率的に取得可能です。文字列の置換ではreplaceを使い、個人情報や特定のデータをマスクすることもでき、セキュリティ面でも役立ちます。複雑なパターンに対しては、段階的に正規表現を組み立てることで、初心者でも無理なく処理を進めることができます。
Kotlinには正規表現と組み合わせて使える便利なメソッドが豊富にあり、matchesやcontainsMatchInを活用することで、文字列全体の一致確認や部分一致チェックが簡単に行えます。これにより、メールアドレスや日付などの形式を厳密に検証したり、文章中のデータを柔軟に抽出したりすることが可能です。
初心者が文字列パースを学ぶ際のポイントは、まず単純な数字や単語の抽出から始め、徐々に複雑なパターンへステップアップすることです。一度に正規表現を全て覚える必要はなく、必要なパターンを組み合わせて使う感覚で学習すると理解が深まります。この記事で紹介した正規表現やsplit、replaceの具体例を実際に手を動かして試すことで、Kotlinでの文字列処理スキルが着実に向上します。
例えば、複数の注文番号を抽出したい場合は、以下のようにRegex.findAllを使います。
fun main() {
val text = "注文番号123、456、789があります"
val regex = "\\d+".toRegex()
val results = regex.findAll(text).map { it.value }.toList()
println(results)
}
[123, 456, 789]
また、CSV形式の文字列を分割して処理する場合はsplitメソッドが有効です。
fun main() {
val csv = "りんご,みかん,バナナ"
val fruits = csv.split(",")
fruits.forEach { println(it) }
}
りんご
みかん
バナナ
このように、Kotlinでは正規表現と文字列操作の組み合わせにより、メールアドレスや電話番号、日付や数字など、様々な形式のデータを効率的に抽出することが可能です。
生徒
「先生、今回学んだ文字列パースのポイントをもう一度整理したいです」
先生
「はい、まず基本はRegexを使ってパターンに一致する文字列を抽出することです。そして、findで単一、findAllで複数を取得できます」
生徒
「メールアドレスや電話番号の抽出はどうやるんでしたっけ?」
先生
「正規表現で形式を指定してfindやmatchesを使うことで、文章中から簡単に抽出できます。必要に応じてreplaceで置換してマスクも可能です」
生徒
「なるほど、段階的にパターンを組み立てれば複雑なデータでも対応できるんですね」
先生
「その通りです。まずは数字や単語の抽出から始め、慣れてきたらメールや日付など複雑なパターンに挑戦すると、無理なく文字列処理をマスターできます」
【未経験OK】Kotlinで始めるプログラミング入門|ゼロから「動く喜び」を体験する60分
「プログラミングを始めたい」を形にする。最新言語Kotlinで楽しむ、ものづくりの第一歩。
本講座は、プログラミング経験が全くない方のためのエントリー講座です。「コードを書くってどういうこと?」という基本から、世界中で使われている最新言語Kotlin(コトリン)を使って、実際にプログラムを動かすまでを体験します。難しい理屈よりも、まずは「自分の手で動かす楽しさ」を最短距離で実感していただきます。
具体的な体験内容と環境
【つくるもの】
簡単な言葉を入力すると自動で返答してくれる「対話型ミニプログラム」や、計算を自動化する「便利ツール」をゼロから作成します。黒い画面に自分の書いた文字が表示される瞬間は、最高の感動体験です。
【開発環境】
プロのエンジニアが実際に使っている開発ツールIntelliJ IDEA(インテリジェイ)をインストールします。ボタン一つで日本語化し、初心者でも迷わず操作できる「魔法の設定」を一緒に行います。
この60分で得られる3つの体験
プロと同じ道具を揃えることで、明日から一人でもプログラミングを続けられる環境が整います。
「変数」や「型」といった難しい言葉も、身近な例え話で解説。モヤモヤをゼロにします。
Kotlinは英語に近くて読みやすいのが特徴。自分でコードを読んで、間違いを見つけるコツも伝授します。
※本講座は、パソコン操作が不安な方でも安心して受講いただける完全マンツーマンです。あなたのペースに合わせて、一つずつ丁寧に進めていきます。
Kotlinで始めるプログラミング入門|ゼロから「動く喜び」を体験