Numpy の配列に最大値が複数。インデックスを全て取得したい – Python

Numpy の ndarray 配列や Series で最大値、最小値の場所を知りたければ argmax、argmin メソッドを使います。ただし、最大、最小値がもし複数あった場合、argmax、argmin は先頭のインデックスを１つだけ返しておわりです。１つじゃなく、すべて知りたい場合は max、min と where を組み合わせます。

- 目次 -

最大値のインデックス
すべて知りたければ
where の役目
最小値のインデックス
Seriesの場合

最大値のインデックス

import numpy as np

data = np.array([1, 2, 3, 999, 1, 2, 999])
#--------------------------------------------
# array([  1,   2,   3, 999,   1,   2, 999])
#--------------------------------------------

data.argmax()
#----------
# 3
#----------

import numpy as np

data = np.array([1, 2, 3, 999, 1, 2, 999])

#--------------------------------------------

# array([ 1, 2, 3, 999, 1, 2, 999])

#--------------------------------------------

data.argmax()

#----------

# 3

#----------

argmax が返してくるのは先頭のインデックスだけ。

すべて知りたければ

np.where(data == data.max())
#-------------------------------
# (array([3, 6], dtype=int64),)
#-------------------------------

np.where(data == data.max())

#-------------------------------

# (array([3, 6], dtype=int64),)

#-------------------------------

data == data.max() の結果を where に渡します。

where の役目

data == data.max() の部分は True、False の配列を戻します。

(data == data.max())
# array([False, False, False,  True, False, False,  True], dtype=bool)
#                               ↑                    ↑
#                               max() と等しければ True

(data == data.max())

# array([False, False, False, True, False, False, True], dtype=bool)

# ↑ ↑

# max() と等しければ True

where は、配列を調べて値が True のインデックスを返します。
つまり、data.max() と値が等しい場所をまとめて知らせてくれるわけです。

最小値のインデックス

括弧のなかを min にするだけです。

np.where(data == data.min())
#-------------------------------
# (array([0, 4], dtype=int64),)
#-------------------------------

np.where(data == data.min())

#-------------------------------

# (array([0, 4], dtype=int64),)

#-------------------------------

Seriesの場合

Series も同様です。

from pandas import Series

ss = Series([1, 2, 3, 999, 1, 2, 999])
#----------
# 0      1
# 1      2
# 2      3
# 3    999
# 4      1
# 5      2
# 6    999
#----------

np.where(ss == ss.max())
#-------------------------------
# (array([3, 6], dtype=int64),)
#-------------------------------

from pandas import Series

ss = Series([1, 2, 3, 999, 1, 2, 999])

#----------

# 0 1

# 1 2

# 2 3

# 3 999

# 4 1

# 5 2

# 6 999

#----------

np.where(ss == ss.max())

#-------------------------------

# (array([3, 6], dtype=int64),)

#-------------------------------

コード７区

機械学習とかpythonとか

Numpy の配列に最大値が複数。インデックスを全て取得したい – Python

最大値のインデックス

すべて知りたければ

where の役目

最小値のインデックス

Seriesの場合

コメントはお気軽にコメントをキャンセル

最大値のインデックス

すべて知りたければ

where の役目

最小値のインデックス

Seriesの場合

コメントはお気軽に コメントをキャンセル

コメントはお気軽にコメントをキャンセル