HTMLからデータを抽出して毎日の転送量の事を思うとやってられないという気持ちが出てきてたぶん転送量とか生のCSVを取るのと比べて100倍くらいは、非効率なんじゃないだろうか。YAHOO FINANCEプレミアム会員になろうとも思ったが、Data-get のアカウントを持ってるので1か月だけ更新してみた。1500円。毎月1500円の副収入が得られるようになったら継続していこうと思う。
でもdata-get の株価は十分だけど、時系列データを取ろうとするとちょっと骨が折れる。
基本的に日々データなので銘柄毎に変換してやる必要がある。
RaspberryPI上に株価データを構築することにする。
といっても、過去にすでにインストール済みであったため、何もすることが無かった。
create table tbl_dg_ohlc( d CHAR(8), s CHAR(4), m CHAR(2), o float, h float, l float, c float, v float, primary key(d,s,m) );
で、テーブルを作って日々データを解凍して
load data local infile '201601.txt' replace into table tbl_dg_ohlc fields terminated by ',' lines terminated by "\r\n";
みたいな日時作業にできる。
「なんでフィールド名短いネン!」
って突っ込みはあろうが、日々データをいつも見てると
F_SECURITY_CODEみたいな、フィールド名つけるのも面倒くさい。
自分専用だからこれで十分明快なのだ。
d→ 日付
s→証券コード
m→市場コード
o→始値
h→高値
l→低値
c→終値
v→出来高
select * from tbl_dg_ohlc where s="9984";な感じでソフトバンクだけの時系列データをとれるようになった ワイ♪ あと解凍するときはunzipをインストールしたら入ってくる funzip が便利。 標準出力に出るのでコマンドラインにまとめやすい。
0 件のコメント:
コメントを投稿