Google BigQueryで日本語(漢字、ひらがな、カタカナ)を正規表現で検索する
ググっても以外に例がなかったので、こちらにメモとして残しておきます。
BQではre2というライブラリを使って正規表現をサポートしてますので、この辺の資料を参考にしました。
https://github.com/google/re2/wiki/Syntax
ひらがなを含んだものを検索する
select
name
from
people
where
REGEXP_CONTAINS(name, '\\p{Hiragana}')
カタカナを含んだものを検索する
select
name
from
people
where
REGEXP_CONTAINS(name, '\\p{Katakana}')
漢字はこんな感じ
select
name
from
people
where
REGEXP_CONTAINS(name, '\\p{Han}')