buq’s blog

覚えておきたいけど覚えておけなさそうなことを書きます?

2017-01-01から1年間の記事一覧

pandas の df (というか series) でカラムをフィルターするには isin

stackoverflow.com isin というのが強いっぽい value_list = ['a', 'abc', 'panda'] df[df['col_name'].isin(value_list)] rpt[rpt['STK_ID'].str.contains(r'^600[0-9]{3}$')] # ^ means start of string これは意味分かるけど syntax どうなってるんだろう…

メモ:Bosch Production Line Performance Competition で使われたアルゴリズム

blog.kaggle.com から抜粋してメモ. 1. Ankita Mangal & Nishant Kumar カテゴリカル変数が 2k 個と多く, one-hot representation してそのまま学習は辛い → Follow the Regularized Leader (FTRL) algorithm (何これ) を使って, 2k 個のカテゴリカル変数…