いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

【Python】EXCEL表の特定の範囲をDatFrameにしたい。

・お題:EXCELからデータを抜き出したいが、EXCELの形式上、特定領域に読みたい表がある。領域を指定して表を読み込みたい。

 

・以下のEXCELファイルから、NameとScoreの表だけ抜き出してDataFrameにしたい。

・まず、ライブラリopenpyxlをインストールする。

・次に、データを 読み込んでみた。

import pandas as pd
df=pd.read_excel("20221022test.xlsx")

・隅っこから読み込まれるので、このような形になる。

・どの行から読み込むか、どの行をヘッダとして読み込むかを指定する。

df2=pd.read_excel("20221022test.xlsx",header=3)

df2は以下になる。

・次に、このうちどの列を読み込むのか指定する。

df3=pd.read_excel("20221022test.xlsx",header=3,usecols=[1,2])

df3は以下になる。

・これでもOK。ついでに、IndexにNameを指定する。

df4=pd.read_excel("20221022test.xlsx",header=3,usecols=[1,2],index_col=0)

・お尻の行を削ることもできる。例えばお尻の1行を削る。

df5=pd.read_excel("20221022test.xlsx",header=3,usecols=[1,2],index_col=0,skipfooter=1)

・組み合わせてうまいこと使いたいところ。

 

おわり。