書籍TOP
工事担任者試験
その他資格・検定
通信・ネットワーク
コンピュータ
ビジネス
その他

≪バックナンバー購入≫
テレコミュニケーション
コールセンタージャパン

データダウンロード
正誤表一覧


支払方法・送料
問い合わせ先
特商法による表示
買物カゴを見る






  データサイエンティストの基礎知識
挑戦するITエンジニアのために
 

データ分析の仕事をR言語で疑似体験
中川慶一郎・小林佑輔 編著
A5判 320ページ
定価:2,400円+税
ISBN:978-4-89797-953-3
2014年10月下旬刊行
本書では主にR言語を用い、データ分析の仕事を疑似体験します。後半ではOSSの「オンライン機械学習フレームワーク」を実際に使って簡単なレコメンデーションシステムを開発するほか、Twitter上の拡散ネットワークの可視化等を試みます。いずれも、第一線の現役データサイエンティスト集団が手引きします。

購入する


■サンプルソースのダウンロードはこちらから


本書はR言語やPython、Javaのプログラミングスキル、SQLやシステム開発の基本を習得したITエンジニアを対象としています。その方々が、情報分析活用の基本的な技術を身につけることを目的とした入門書です。執筆陣は、実際にビジネスアナリティクスの業務に携わっているデータサイエンティストたちです。そして、従来型の集計分析から、Twitter のような新しいタイプのデータを用いた分析まで、様々な具体例を用意しました。(中略)本書を読み進めるうちに、どのように分析を行うのか、どのようにツールを活用するのかといった実際のビジネスアナリティクスの業務について、より鮮明にイメージできると思います。

───本書「はじめに」より抜粋・編集


緊急告知
R言語のパッケージが一部変わりました

本書の第3章「3-3-5 探査型アプローチ」では、P.143でR言語の「mvpart」パッケージをインストールことになっています。ところが本書刊行後の2014年12月、mvpartは公式サイトから除外され、インストールできなくなってしまいました。

対策はあります。mvpartの代わりに「rpart」パッケージを用い、本書記載のサンプルコードに若干の修正を加えれば、実用上問題なく使用できます。
この対処方法をPDF資料にまとめましたので、詳しくはそちらをご覧ください。

「mvpart」のインストールについて(PDF版)


■本書の主な内容
第1章 分析とは
1-1 ビッグデータ時代の到来
1-2 ビッグデータとは何か?
1-3 BIからBAへ
1-4 データサイエンティスト
1-5 本書を読むにあたって
第2章 データ分析に必要なスキル
2-1 分析プロジェクトの進め方
2-2 IT領域の技術
2-3 分析領域の技術
2-4 ビジネス領域の知識
第3章 ケーススタディ 分析編
3-1 四つの分析型
3-2 集計分析型で原因をあぶり出す
3-3 集計分析型のケーススタディ
3-4 発見型で隠れた法則を見つけ出す
3-5 発見型のケーススタディ
第4章 ケーススタディ 予測編
4-1 What-If型で新しい業務をデザインする
4-2 What-If型のケーススタディ
4-3 プロアクティブ型で先手を打つ
4-4 プロアクティブ型のケーススタディ
4-5 実装上のいくつかの留意点
第5章 新しい基盤技術〜OML〜
5-1 ビッグデータ処理技術の二つの方向
5-2 オンライン機械学習ライブラリ「Jubatus」
5-3 Jubatus環境の構築
5-4 RSS feedのオススメ記事分類
第6章 新しいデータ〜SNS〜
6-1 SNSデータへの期待と注意点
6-2 Twitterデータの分析
6-3 拡散ネットワークの分析
付録 Rのインストールと操作の基本
A-1 R言語のインストール手順
A-2 R言語の基本的な使い方
A-3 その他のツールのインストール手順