【Python】文字列を置換する (replace、translate、re.sub)

文字列を置換する方法を3つ紹介します。

  • 文字列のメソッド str.replace()を使う
  • 文字列のメソッド str.translate()を使う
  • 正規表現 re.sub()を使う

最初の2つ(replaceとtranslate)は置き換える文字列が決まっている場合に簡単に書けます。最後の正規表現を使う方法は、検索する文字列のパターンを決めて置き換えることができるので、より高度な使い方ができます。
“【Python】文字列を置換する (replace、translate、re.sub)” の続きを読む

【Python】 特定の文字や文字列の出現回数を数える(count)

count()は、シーケンス型(リスト、タプル、range, 文字列etc)の共通メソッドで、特定の文字(列)や要素の出現回数をカウントしてくれます。例えば、

  • ある文字列の中に文字”a”が何個あるか?
  • リストに、”Apple”という要素が何個あるか?

こんな場合に便利です。
また、collections.Counter()は、リストに含まれる要素がそれぞれ何個あるのかをまとめて出力してくれます。テキストデータに含まれる単語の出現頻度をまとめて出力することにも使えそうです。
“【Python】 特定の文字や文字列の出現回数を数える(count)” の続きを読む

【Python】文字列を検索する(in演算子、find、正規表現)

ある文字列が部分文字列として含まれているか、またその位置を知りたい場合は、

  • 存在しているかどうかを確認する場合はin/not in演算子
  • 存在場所(インデックス)も取得するならfindメソッド、正規表現(re.search().span())

を用いることができます。
今回は、文字列を検索する方法についてまとめます。 “【Python】文字列を検索する(in演算子、find、正規表現)” の続きを読む

【Python】 map関数の使いかた

map()は、イテラブルの要素を任意の関数に渡して新たなイテレータオブジェクトを生成する関数です。例えば、

  • リストの文字列の数字の要素をまとめてint型に変換したい
  • リストの各要素の数値をある関数に適用して、その結果を新しいリストで生成したい

こんな場面に使えます。尚、同様の機能はforループや内包表記を使って書くことも出来ますが、可読性や実行効率を考慮して使い分けるのが良いと思います。 “【Python】 map関数の使いかた” の続きを読む

【Python】 特定の文字列や空白文字を削除する (strip, rstrip, lstrip、replace)

入力フォームから文字列を取得して何らかの処理を実行したり、複数行のテキストデータを行毎、更に単語毎に分解してテキスト解析を行ったりする際、得られた文字列の末尾にスペース改行(\n)が入ってしまい、思ったような結果が得られないことがあります。
このような場合に役に立つのが、文字列のメソッドの

  • str.strip(), str.ltrip(), str.rtrip()
  • str.replace()

です。いずれも任意の文字(列)を削除することが出来ますが、それぞれ動きが異なるので、用途に応じて使い分けると便利です。 “【Python】 特定の文字列や空白文字を削除する (strip, rstrip, lstrip、replace)” の続きを読む

【Python】split関数を使った文字列の分割方法

  • スペース区切りで文字列(文章スペース区切りの入力値)を分割したい!
  • カンマ(,)区切りで文字列(何らかのデータ等)を分割したい!

こんな時は、文字列のメソッドのsplit()を使うと便利です。この関数はスペースやカンマ(,)だけでなく任意の文字列を区切り文字として設定することも出来ます。今回は、この関数の使い方についてまとめます。
“【Python】split関数を使った文字列の分割方法” の続きを読む

[Python] リストの最大値、最小値とそのインデックスを取得する(max, min, index)

プログラムの中で

  • リストの最大値や最小値を取得したい!
  • 最大値(最小値)を取る要素のインデックスを取得したい!
  • 最大値が複数あるんだけど、全部のインデックスが知りたい!

こんな場合は、標準組み込み関数のmax()、min()およびindex()を使うと実現できます。
特に、最大値(最小値)が複数ある場合は少し注意が必要ですので、このあたりも含めて、基本的な使い方についてまとめます。 “[Python] リストの最大値、最小値とそのインデックスを取得する(max, min, index)” の続きを読む

[Python] 辞書に存在しないキーを登録する(setdefault)

辞書にデータ(key, valueペア)を登録する際に、

キーが辞書に存在しないデータのみ登録したい!

こういう場面があると思います。
今回はこんな時に役に立つ「キーが辞書に存在しないデータのみを登録する方法」として、

  • not in演算子を使ったキーの存在を確認する方法、および
  • 組み込み関数setdefault()を使う方法

についてまとめます。
“[Python] 辞書に存在しないキーを登録する(setdefault)” の続きを読む

[Python] enumerate()の使い方(インデックス付きforループ)

 リストをforループで回して要素を取り出す際に、インデックスも一緒にほしい場合があります。そのような場合はenumerate()を使うと、簡単に取得できます。
 enumerate()はPythonの標準組み込み関数で、イテラブル(リスト、タプル、文字列、辞書など)の各要素にインデックスを付けて新しいイテラブルを生成します。
 本記事では、この関数の使い方についてまとめます。

“[Python] enumerate()の使い方(インデックス付きforループ)” の続きを読む