pandazx's blog

データ分析など雑多な技術ブログ

2014-07-01から1ヶ月間の記事一覧

RのRandom Forestの結果を毎回同じにする

R

Random Forestはその名の通りランダムに処理するので結果が毎回変わる。 これを毎回、同じにするためには set.seed(1) とすればよい。 指定する値は何でもよい。

Verticaのデータ削除

delete from で削除できるが、Verticaでは結果の確定をするために commit; を実行する必要があるので注意。 commit; しないでログアウトすると、削除されない。バッチ的に削除する場合は以下のようにする。 vsql -U dbadmin -w password -c "delete from tab…

ffmpeg で動画分割

動画ファイルの再生時間の取得 ffmpeg -i [動画ファイル] 2>&1 | grep Duration | awk '{print $2}' | tr -d ,参考:linux - How to extract duration time from ffmpeg output? - Stack Overflow 動画分割 ffmpeg -i [元動画] -ss [開始位置(秒数)] -t [切…

機械学習の正則化項とは

機械学習の理論でよく見かけるので意味を調べてみました。SVMにおける損失と正則化 http://d.hatena.ne.jp/tkng/touch/20090119/1232340992このブログによると、たいていの機械学習のアルゴリズムは最小化するべき目的関数が、「損失関数+正則化項」という形…