(English follows Japanese)
日本語タイトル:ビッグデータに立ち向かう? JMP®でデータを解く。
ローリンズ大学、国際経済(米フロリダ州オーランド) 准教授 Michele Boulanger (ミシェル・ブーランジェ)
SAS Institute Inc. JMPアカデミック アンバサダー Mia Stephens (ミア・ステーブンス)
大半の分野におけるトランザクション データを取得する我々の能力が、「ビッグデータ」の時代を開いた。「ビッグデータ」とは何か?「ビッグ」は、汚い、散らかった、不整合、または扱いにくいことを必然的に意味するのか? ビッグデータの世界では、どのくらいの調整、調節が必要になるのか?ビッグデータの世界での準備、クレンジング段階から区別するものは何なのか?この講演で、ビッグデータ分析の潜在的に最も時間のかかる段階で遭遇するさまざまな課題を論じる。つまりデータの準備について論じる。2つの事例を提示する予定だが、それぞれが非常に異なる目的を持っており、モデリングのためのデータ形成には異なったアプローチを必要とする。これらのアプローチと共にJMP からの方法とプラットフォームについて強調するが、それは例えば、クエリ、リコード、標準化、変換、帰属、テキストマイニングなどであり、それらはモデリング段階でのビッグデータを準備するために、追跡可能で再現可能な方法論を開発するためのものである。JMP13を使用してデモを行う。
Shaping up Big Data ? A data workout with JMP
Michele Boulanger, Professor, International Business Department, Rollins College, Orlando
Mia Stephens, JMP Academic Ambassador, SAS (Co-Author)
Our ability to capture transactional data in most fields has led us to the era of “big data”. What is big data? Does “big” necessarily mean dirty, messy, inconsistent, or unwieldy? How much toning and conditioning do we need to do in the big data world? What differentiates preparation in the big data world from the traditional data cleaning phase? In this talk we discuss the different challenges encountered in potentially the most time-consuming phase of big data analytics: data preparation. We present two case studies with very different goals, requiring different approaches to shaping up the data for modeling. Along with these approaches, we also highlight techniques and platforms from JMP such as query, recode, standardization, transformation, imputation, text mining, and others to develop a traceable and reproducible methodology to prepare big data for the modeling phase. All demonstrations will be done live with JMP Pro 13.