・お題:EXCELからデータを抜き出したいが、EXCELの形式上、特定領域に読みたい表がある。領域を指定して表を読み込みたい。
・以下のEXCELファイルから、NameとScoreの表だけ抜き出してDataFrameにしたい。
・まず、ライブラリopenpyxlをインストールする。
・次に、データを 読み込んでみた。
import pandas as pd
df=pd.read_excel("20221022test.xlsx")
・隅っこから読み込まれるので、このような形になる。
・どの行から読み込むか、どの行をヘッダとして読み込むかを指定する。
df2=pd.read_excel("20221022test.xlsx",header=3)
df2は以下になる。
・次に、このうちどの列を読み込むのか指定する。
df3=pd.read_excel("20221022test.xlsx",header=3,usecols=[1,2])
df3は以下になる。
・これでもOK。ついでに、IndexにNameを指定する。
df4=pd.read_excel("20221022test.xlsx",header=3,usecols=[1,2],index_col=0)
・お尻の行を削ることもできる。例えばお尻の1行を削る。
df5=pd.read_excel("20221022test.xlsx",header=3,usecols=[1,2],index_col=0,skipfooter=1)
・組み合わせてうまいこと使いたいところ。
おわり。