【Python】文字列を置換する (replace、translate、re.sub)

文字列を置換する方法を3つ紹介します。

  • 文字列のメソッド str.replace()を使う
  • 文字列のメソッド str.translate()を使う
  • 正規表現 re.sub()を使う

最初の2つ(replaceとtranslate)は置き換える文字列が決まっている場合に簡単に書けます。最後の正規表現を使う方法は、検索する文字列のパターンを決めて置き換えることができるので、より高度な使い方ができます。
“【Python】文字列を置換する (replace、translate、re.sub)” の続きを読む

【Python】 特定の文字や文字列の出現回数を数える(count)

count()は、シーケンス型(リスト、タプル、range, 文字列etc)の共通メソッドで、特定の文字(列)や要素の出現回数をカウントしてくれます。例えば、

  • ある文字列の中に文字”a”が何個あるか?
  • リストに、”Apple”という要素が何個あるか?

こんな場合に便利です。
また、collections.Counter()は、リストに含まれる要素がそれぞれ何個あるのかをまとめて出力してくれます。テキストデータに含まれる単語の出現頻度をまとめて出力することにも使えそうです。
“【Python】 特定の文字や文字列の出現回数を数える(count)” の続きを読む

【Python】文字列を検索する(in演算子、find、正規表現)

ある文字列が部分文字列として含まれているか、またその位置を知りたい場合は、

  • 存在しているかどうかを確認する場合はin/not in演算子
  • 存在場所(インデックス)も取得するならfindメソッド、正規表現(re.search().span())

を用いることができます。
今回は、文字列を検索する方法についてまとめます。 “【Python】文字列を検索する(in演算子、find、正規表現)” の続きを読む

【Python】 特定の文字列や空白文字を削除する (strip, rstrip, lstrip、replace)

入力フォームから文字列を取得して何らかの処理を実行したり、複数行のテキストデータを行毎、更に単語毎に分解してテキスト解析を行ったりする際、得られた文字列の末尾にスペース改行(\n)が入ってしまい、思ったような結果が得られないことがあります。
このような場合に役に立つのが、文字列のメソッドの

  • str.strip(), str.ltrip(), str.rtrip()
  • str.replace()

です。いずれも任意の文字(列)を削除することが出来ますが、それぞれ動きが異なるので、用途に応じて使い分けると便利です。 “【Python】 特定の文字列や空白文字を削除する (strip, rstrip, lstrip、replace)” の続きを読む

【Python】formatを用いた書式設定の基本

str.format()は文字列の書式を設定することができます。例えば、

  • 小数点以下の桁数を3桁にしたい
  • 文字列を右詰めして、空いた左側は*で埋めたい
  • 10進数を2進数に変換して表示したい
  • 数値を3桁毎にカンマ(,)で区切りたい

本記事では、str.format()の使い方と併せて、書式設定の書き方を具体例を中心にまとめます。 “【Python】formatを用いた書式設定の基本” の続きを読む

【Python】split関数を使った文字列の分割方法

  • スペース区切りで文字列(文章スペース区切りの入力値)を分割したい!
  • カンマ(,)区切りで文字列(何らかのデータ等)を分割したい!

こんな時は、文字列のメソッドのsplit()を使うと便利です。この関数はスペースやカンマ(,)だけでなく任意の文字列を区切り文字として設定することも出来ます。今回は、この関数の使い方についてまとめます。
“【Python】split関数を使った文字列の分割方法” の続きを読む

[Python] 文字列の大文字・小文字変換 (str.upper, str.lower etc..)

文字列(str型)が提供しているメソッドのstr.upper()、str.lower()を使うと、英字をそれぞれ大文字、小文字に変換することが出来ます。また、他にも先頭文字のみ大文字(Title Case)に変換するなどのメソッドもあります。
本記事では、これらの使い方についてまとめます。 “[Python] 文字列の大文字・小文字変換 (str.upper, str.lower etc..)” の続きを読む