2017-02-01から1ヶ月間の記事一覧

pyarrowを試してみた

pyarrowでのparquetの読み込みとDataFrameへの変換のパフォーマンスを確認してみた。 parquetは読み込みは当然csvよりも早いけど。DataFrameへの変換が遅いのでpandasの壁は越えられない...

データサイエンスチームをどのように作るのか?

前回の記事を書いている時に見つけたQuoraの質問がその時ちょうど考えていたことにぴったりだったので、内容をまとめておこうと思います。 How do I build a data science team? Ricardo Vladimiro氏 は回答の中で、チームを作るための手順を3つにまとめて…

面接官「何故弊社でなければならないの?」

ちょうど、採用について考えている時、次のまとめをタイムラインで見つけた。 togetter.com コメントの多くは求職側は待遇と仕事の内容が条件と合うならどこでもいいと思っているでしょ?そんなこと聞くなよ という趣旨のものだが、 採用側からすると採用後…