ノートPCのマーケティングリサーチ
この記事は2016年11月28日に公開した記事を加筆修正したものです
Table of Contents
テーマの意義
最近大学生でも、MacBookやsurfaceなどのいわゆる高性能高額なタブレットPCを使用していることをしばしば見受ける。「スタバでMac」などこじゃれた象徴のようになり、現に大学に付設されているスターバックスコーヒーにいけばMacやsurfaceを使用して何かしらしている人は必ず一人二人はいるものだ。(わたしはこの原稿をセブンイレブンのコーヒーを飲みながら、大学のコンコースの椅子に座り執筆しているが…)
有効に使えているのか?という議論は尽きない。ただ今回はそれは置いといて、大学生がノートPCに求めることは何なのかを考察したい。もしそれを真に満たすものが「MacBook」やら「surface」でないなら…ということになるだろう。
調査方法
というわけで上記のことを調査するために以下のような質問票を作成した(google form)でも回答を求めた。(カバーレターを付して内容は全く同じ質問票を紙でも回答してもらった)
総合的満足度を聞いたうえで、各々PCに求められる項目と判断した評価項目を5段階のリッカート尺度で問うている。また回生や実家下宿、性別など重視する項目に差が出ると思われる変数も入れている。
なので、今後「NotePCMR.csv」を用いて分析をしていこう(NotePCは日本語の造語ではあるが、NotebookとかLaptopとかだと長いので勘弁していただきたい)
分析結果
以下のような結果になりました。
- 「持ち運びやすい」ということはかなり重要
- 「デザイン」は男性でも女性でも有意な相関はない。(満足度なので買う時ぐらいにしか気にしないのかもしれない)
- 「価格」は下宿生は強く意識するものの、実家通いは意識せず(自分で買ってない可能性大)
- 「性能」はやはり意識されるようだ(といっても高性能だと起動が遅いなどはあまりないので、MacBook/surfaceユーザーは気づいてないかも。)
- 「ソフト面」(サポート修理・搭載ソフトなど)は意識されていない。満足要因ではなくても、不満足要因になりうるだろう) 以下このような結論に至るまでを書いていきます。
データ整形
さて、まずは欠損値・天井効果・フロア効果・回答がおかしいなどのデータをはじいていこう。今回分析対象から外されるデータは以下のとおりである。
- 回答不備がある回答
- 天井効果・床効果がある質問項目
- 回答が指定の値(0から100)を超えている場合(マイナスや10000点など)
- リッカート尺度の回答が単一(すべて3,すべて5など)
PCdata <- read.csv("NotePCMR1.csv") #データ読み込み PCdata <- na.omit(PCdata)#欠損値除去 M_PCdata <- sapply(PCdata, mean)#平均の列ごとに計算 SD_PCdata <- sapply(PCdata, sd)#標準偏差を列ごとに計算 CeilingEffect <- M_PCdata + SD_PCdata#天井効果を計算 FloorEffect <- M_PCdata - SD_PCdata#床効果を計算 CeilingEffect <- CeilingEffect[13:25]#リッカート尺度だけを取り出す FloorEffect <- FloorEffect[13:25]#同上 print(split(CeilingEffect,CeilingEffect>5))#5<天井効果を取り出す
## $`FALSE` ## 処理速度 記憶容量 軽量 薄さ 大きさ 丈夫 ## 4.141383 4.467215 4.250318 4.504793 4.147986 4.151427 ## バッテリー 色 ロゴ ソフト 価格 保障修理 ## 3.956249 4.767808 4.161579 4.167646 3.940133 4.250400 ## サポート ## 4.044956
print(split(FloorEffect,FloorEffect<1))#1>床効果を取り出す
## $`FALSE` ## 処理速度 記憶容量 軽量 薄さ 大きさ 丈夫 ## 2.048273 2.653474 1.542785 1.736586 1.524428 2.331332 ## バッテリー 色 ロゴ ソフト 価格 保障修理 ## 1.992027 2.490813 2.045318 2.159940 1.887453 2.525462 ## サポート ## 2.351596
まず欠損値除去して、各列の平均標準偏差を計算。その後足した天井効果と引いた床効果を見てみると、すべて天井効果・床効果ともにFLASE(効果なし)と認められた。よかった。
つぎはリッカート尺度の回答がすべて単一なのをはじく。ここでは標準偏差が0である場合をはじく。
Li5<-PCdata[,13:25]#リッカート尺度だけを取り出し SD <- apply(Li5,MARGIN = 1,sd)#各回答者の標準偏差を求める PCdata <- cbind(PCdata,SD)#標準偏差=0つまり回答がすべて同じ数字 PCdata <- subset(PCdata, PCdata$SD != 0)#標準偏差が0の回答をはじく
最後のsubsetでPCdataの中で回答の標準偏差が0出ないものをPCdataに格納しなおす。以上のことをすればデータ整形は終了!
因子分析!
N-noteのマーケティングリサーチ(~質問票まで)をみていただければ、今回の質問票に関して以下の5つの仮説を基に作成した。
ノートPCの満足度に影響するのは
- 性能
- もちはこびやすさ
- ソフト面
- デザイン
- 価格
さて因子分析していこう。因子分析では因子数の決定をはじめにしなければなりません。一応今回は最初の仮設設定で5つと設定していりが、一応固有値など確認しておく。
Li5 <- PCdata[,13:25] cor01 <- cor(Li5) eigen01 <- eigen(cor01)$values; eigen01 plot(eigen01, type="b", main="Scree Plot",xlab="Number", ylab="Eigenvalue")
傾きは3ぐらいから緩やかになってるものの、固有値は6ぐらい行かないと1を切らない.とりあえず因子分析をかけてみる
library(psych) fit <- fa(r=Li5, nfactors=5, rotate="promax", fm="pa") print(fit)
## Factor Analysis using method = pa ## PA1 PA2 PA3 PA5 PA4 h2 u2 com ## 処理速度 0.19 -0.02 0.11 0.00 0.21 0.088 0.912 2.5 ## 記憶容量 0.02 0.04 -0.08 0.00 0.92 0.881 0.119 1.0 ## 軽量 0.91 -0.08 -0.02 -0.05 0.03 0.797 0.203 1.0 ## 薄さ 0.92 0.02 0.05 0.01 0.02 0.844 0.156 1.0 ## 大きさ 0.84 0.02 0.01 0.15 -0.03 0.784 0.216 1.1 ## 丈夫 0.10 0.23 0.03 0.00 -0.11 0.074 0.926 1.9 ## バッテリー 0.29 0.22 -0.22 -0.04 -0.12 0.233 0.767 3.2 ## 色 -0.12 0.03 -0.04 0.40 -0.11 0.175 0.825 1.4 ## ロゴ 0.09 -0.05 -0.02 0.87 0.01 0.775 0.225 1.0 ## ソフト -0.10 0.28 0.04 0.20 0.17 0.180 0.820 2.9 ## 価格 0.04 0.11 1.01 -0.02 -0.07 0.986 0.014 1.0 ## 保障修理 -0.07 0.68 -0.13 -0.09 0.00 0.477 0.523 1.1 ## サポート 0.00 0.89 0.15 -0.01 0.04 0.754 0.246 1.1
biplot(fit$scores, fit$loading, cex = 2)
「丈夫」「バッテリー」「ソフトウェア」が全く因子として機能してくれてない。因子負荷が全部0.4以下。丈夫はなんかやっつけでいれた質問項目なので仕方がないにしても、バッテリーとソフトウェアは結構自信があったので残念で仕方ない。
けど仕方がないので、上記3つの因子を取り外してもう一度因子分析。
Li5 <- Li5[c(-6,-7,-10)] fit <- fa(r=Li5, nfactors = 5, rotate = "promax", fm="pa") biplot(fit$scores, fit$loading, cex = 2)
sort.loadings <- function(x) { a <- x$loadings y <- abs(a) # 因子負荷量の絶対値 z <- apply(y, 1, which.max) # 各変数をどの因子に含めるべきか loadings <- NULL # 結果 for (i in 1:ncol(y)) { b <- a[z == i,, drop=FALSE] if (nrow(b)) { t <- order(abs(b[, i, drop=FALSE]), decreasing=TRUE) # 因子単位で並べ替え情報を得る loadings <- rbind(loadings, b[t,, drop=FALSE]) } } class(loadings) <- "loadings" # クラスの設定 return(loadings) # 結果を返す } sort.loadings(fit)
## ## Loadings: ## PA1 PA2 PA3 PA4 PA5 ## 薄さ 0.920 ## 軽量 0.906 ## 大きさ 0.852 0.154 ## サポート 0.869 0.214 0.128 ## 保障修理 0.745 -0.212 -0.130 ## ロゴ 0.128 0.625 ## 色 -0.142 0.566 ## 価格 -0.105 0.647 ## 記憶容量 -0.290 0.535 ## 処理速度 0.121 0.499
薄さ・軽量・大きさの持ち運びやすさ因子、サポート保障修理のソフト面因子、ロゴ・色のデザイン因子、価格因子、記憶容量・処理速度の性能因子が無事確定
続いて因子の信頼係数を求めてみる。
alpha(Li5[c(1,2)]) alpha(Li5[c(3,4,5)]) alpha(Li5[c(6,7)]) alpha(Li5[c(9,10)])
信頼係数をまとめると以下の通り。
因子名 | 信頼係数 |
---|---|
持ち運びやすさ | 0.92 |
ソフト面 | 0.74 |
デザイン | 0.5 |
性能 | 0.35 |
性能…一応今回は公の調査ではないので使用するが、信頼係数0.35はほぼ信用できない。
因子得点は単純平均を使用。
Factor <- data.frame(Li5[1]) Q <- list(c(1,2),c(3,4,5),c(6,7),8,c(9,10)) for (i in Q){ N<-apply(Li5[i],MARGIN = 1,mean) N <- data.frame(N=N) Factor <- cbind(Factor,N) } Factor <- Factor[-1] names(Factor) <- c("spec","mobility","design","price","software") PCdata<- cbind(PCdata,Factor) head(Factor)
## spec mobility design price software ## 1 3.0 1.000000 3.5 4 3.0 ## 2 3.0 2.000000 4.0 4 2.0 ## 3 3.0 3.333333 3.0 5 1.5 ## 5 3.5 2.000000 3.5 2 4.0 ## 6 4.5 2.000000 5.0 1 3.5 ## 7 3.5 1.000000 4.5 3 3.5
こんな感じの因子得点。さてそれでは次章から相関分析・重回帰分析
相関分析
相関分析をする。
Factornames <- c("点数",names(Factor)) library(GGally) library(ggplot2) assignInNamespace("ggally_cor", ggally_cor, "GGally") ggpairs(PCdata[Factornames])
相関分析したところ、有意なのは性能・持ち運びやすさと得点の間。加えてスペックと持ち運びやすさにも10%有意だった。
デザイン・価格・ソフト面は満足度と全く関係ないという結果になってしまった。性能と持ち運びやすさで因子間の相関があるものの、0.18と相関係数が低いので特に問題はないだろう。 このあと様々なほかの変数を用い(ex. 性別・居住形態 etc.)相関分析をしたが、この全体の数字と変わりがなかったので割愛。メインテーマの重回帰分析を行う。
重回帰分析
model1<-lm(点数~spec+mobility+software+design+price,data=PCdata) summary(model1)
## ## Call: ## lm(formula = 点数 ~ spec + mobility + software + design + price, ## data = PCdata) ## ## Residuals: ## Min 1Q Median 3Q Max ## -48.080 -7.499 2.928 11.232 26.927 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 11.8601 11.8375 1.002 0.31860 ## spec 9.1265 2.0190 4.520 1.58e-05 *** ## mobility 4.0307 1.2388 3.254 0.00152 ** ## software 0.6988 2.0287 0.344 0.73115 ## design 1.0619 1.7139 0.620 0.53682 ## price 2.1032 1.4973 1.405 0.16297 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 15.94 on 109 degrees of freedom ## Multiple R-squared: 0.2694, Adjusted R-squared: 0.2359 ## F-statistic: 8.038 on 5 and 109 DF, p-value: 1.751e-06
性能・持ち運びやすさは有意になっているが、そのほかは全滅。修正済みの決定係数は0.235。そのほかの変数を用いていろいろ分析してみる。
下宿<- subset(PCdata,居住形態==1) 家族<- subset(PCdata,居住形態==2) model下宿 <-lm(点数~spec+mobility+software+design+price,data=下宿) model家族 <- lm(点数~spec+mobility+software+design+price,data=家族) summary(model下宿)
## ## Call: ## lm(formula = 点数 ~ spec + mobility + software + design + price, ## data = 下宿) ## ## Residuals: ## Min 1Q Median 3Q Max ## -54.635 -9.007 3.233 10.497 23.399 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 9.3194 15.7136 0.593 0.55556 ## spec 9.2593 2.6584 3.483 0.00098 *** ## mobility 3.6980 1.6158 2.289 0.02597 * ## software 1.1548 2.6784 0.431 0.66804 ## design -0.1894 2.3463 -0.081 0.93596 ## price 5.0935 2.0267 2.513 0.01492 * ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 15.22 on 55 degrees of freedom ## Multiple R-squared: 0.326, Adjusted R-squared: 0.2647 ## F-statistic: 5.319 on 5 and 55 DF, p-value: 0.000467
summary(model家族)
## ## Call: ## lm(formula = 点数 ~ spec + mobility + software + design + price, ## data = 家族) ## ## Residuals: ## Min 1Q Median 3Q Max ## -39.404 -6.486 3.516 12.051 27.299 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 12.8882 17.7222 0.727 0.4706 ## spec 7.6463 3.1255 2.446 0.0181 * ## mobility 3.9488 1.9321 2.044 0.0465 * ## software 1.9490 3.2062 0.608 0.5461 ## design 2.4424 2.5541 0.956 0.3437 ## price -0.3674 2.2419 -0.164 0.8705 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 16.46 on 48 degrees of freedom ## Multiple R-squared: 0.2589, Adjusted R-squared: 0.1817 ## F-statistic: 3.354 on 5 and 48 DF, p-value: 0.01118
これまた面白い。下宿生は持ち運びやすさ、性能、価格が有意になっている。対して実家生は価格に対して無頓着(?)下宿生の場合価格変数が有意になっているのに、実家生だとp値0.8705。
男 <- subset(PCdata,性別==1) 女 <- subset(PCdata,性別==2) model男 <-lm(点数~spec+mobility+software+design+price,data=男) model女 <- lm(点数~spec+mobility+software+design+price,data=女) summary(model男)
## ## Call: ## lm(formula = 点数 ~ spec + mobility + software + design + price, ## data = 男) ## ## Residuals: ## Min 1Q Median 3Q Max ## -48.973 -9.643 3.829 11.425 24.485 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 5.9665 15.7595 0.379 0.706239 ## spec 11.1114 2.7139 4.094 0.000121 *** ## mobility 4.7833 1.6790 2.849 0.005893 ** ## software 0.2409 2.7245 0.088 0.929807 ## design 1.2027 2.3716 0.507 0.613809 ## price 1.6247 1.9121 0.850 0.398673 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 16.74 on 64 degrees of freedom ## Multiple R-squared: 0.306, Adjusted R-squared: 0.2518 ## F-statistic: 5.644 on 5 and 64 DF, p-value: 0.0002264
summary(model女)
## ## Call: ## lm(formula = 点数 ~ spec + mobility + software + design + price, ## data = 女) ## ## Residuals: ## Min 1Q Median 3Q Max ## -43.704 -6.232 0.800 12.987 25.249 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 17.6415 19.7208 0.895 0.3765 ## spec 6.6181 3.3508 1.975 0.0554 . ## mobility 3.0853 2.0303 1.520 0.1367 ## software 1.7095 3.4106 0.501 0.6190 ## design 0.4577 2.7838 0.164 0.8702 ## price 3.3021 2.8216 1.170 0.2490 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 15.26 on 39 degrees of freedom ## Multiple R-squared: 0.246, Adjusted R-squared: 0.1493 ## F-statistic: 2.545 on 5 and 39 DF, p-value: 0.04368
女性はかろうじて有意確率10%で持ち運びやすさが有意。男性は持ち運びやすさと性能かなり気にするみたいですね。
heavy <- subset(PCdata,使用頻度<=4) light <- subset(PCdata,使用頻度==5) modelheavy <-lm(点数~spec+mobility+software+design+price,data=heavy) modellight <- lm(点数~spec+mobility+software+design+price,data=light) summary(modelheavy)
## ## Call: ## lm(formula = 点数 ~ spec + mobility + software + design + price, ## data = heavy) ## ## Residuals: ## Min 1Q Median 3Q Max ## -43.769 -7.914 2.434 11.222 28.518 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 11.562 12.089 0.956 0.34124 ## spec 8.835 2.092 4.224 5.39e-05 *** ## mobility 3.981 1.295 3.074 0.00274 ** ## software 2.044 2.233 0.915 0.36243 ## design 1.196 1.907 0.627 0.53202 ## price 0.640 1.601 0.400 0.69027 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 16.07 on 98 degrees of freedom ## Multiple R-squared: 0.2778, Adjusted R-squared: 0.2409 ## F-statistic: 7.538 on 5 and 98 DF, p-value: 5.034e-06
summary(modellight)
## ## Call: ## lm(formula = 点数 ~ spec + mobility + software + design + price, ## data = light) ## ## Residuals: ## 2 3 14 29 35 50 53 59 ## -0.04902 -2.08643 -1.14704 -1.55559 -4.40031 0.23880 3.40476 7.24503 ## 70 79 85 ## 4.30570 -1.55559 -4.40031 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 3.1724 30.4586 0.104 0.9211 ## spec 12.5688 6.5487 1.919 0.1130 ## mobility 1.0849 2.7845 0.390 0.7128 ## software -2.5784 2.7440 -0.940 0.3905 ## design 0.6188 3.0063 0.206 0.8450 ## price 9.9204 2.5891 3.832 0.0122 * ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 5.136 on 5 degrees of freedom ## Multiple R-squared: 0.9384, Adjusted R-squared: 0.8769 ## F-statistic: 15.24 on 5 and 5 DF, p-value: 0.004776
一日に4時間以上使用している人をヘビーユーザー、それ以下の人をライトユーザーとして分けてみた。これはやはりヘビーユーザー価格を気にせず性能・持ち運びやすさ重視ですね。ライトユーザーは価格しか有意でなかった。これは想像に難くない。
考察
今回の分析結果をもとにいろいろと考えていきましょう。
相関分析
相関分析では性能と持ち運びやすさが、「ノートPCの満足度、性能・持ち運びやすさの間に正の相関がある」ということが確認されました。項目間の相関分析を行っても多重共線性につながるような強い相関は確認されず、重回帰分析に入れました。特に相関分析で深い考察はないので、重回帰分析に行きます。
重回帰分析
重回帰の考察です。協調ばっか使って逆に読みにくくなってしまったのですがごめんなさい。
全体を見て
全体を見たところ、持ち運びやすさと性能が有意。ソフト面・価格・デザインは有意ではなかった。
相関がなかった変数を先に考察します。価格は置いておくとしても、デザインが有意にならなかったのは意外ですね。アンケート回収の際に結構MacBookの人とかも聞いてみると、「リンゴが好きなのではない、MacBookが性能的にもUI的にも使いやすいのだ」的な回答をいただきました。わたしもsurfaceのlogoが好きなわけではないのでそういうことなのでしょう。
ソフト面に関して言及すれば、「満足度を図る調査であったがために有意ではなかった」と考えられます。第一保障修理を全く使ったことがないなんて人もいますし、保証修理に対して不満に思うことはあっても満足に思うことはないように考えられます。今後満足度調査の際はハーズバーグの動機づけ・衛生理論のように、満足要因・不満足要因で分けて考えることが求められと思いますね。この質問は今思い返してみると不適当であったかな?と少し自省しています。
有意であったのは持ち運びやすさ、性能ですね。これは非常に納得できます。大学生となると毎日のように大学にノートPCを持ってくることになります。(まあ持ってこない人もいるとは思います)その時重かったり、厚かったりすると不満に思うのでしょう。また性能も普段使っているときから起動が遅かったり、動作が重かったりするなどして非常に目が付きやすい点です。言ってしまえば持ち運ばないノートPCを買うぐらいなら、デスクトップPCを買ったほうが断然いいですよね。
下宿か実家か
下宿なのか実家なのかでかなり大きな違いが出てきました。それは価格です。
これは「だれがそのノートPCを買ったのか」という問題に帰結するでしょう。実家暮らしの方々はご両親から入学時に買ってもらったor親のをもらったという意見をいただきました(これは質問項目に加えるべきでした…)。対して下宿の方もご両親に買ってもらったり、おさがりだったりする場合もあるかもしれませんが価格にはかなり敏感なようです。
性能はどちらも優位ですが実家暮らしの人より下宿の方のほうが性能のP値が低いです。もしかしたら「実家にデスクトップPCがあるかどうか」が影響していると考えられます。これも質問項目に入れるべきでした…
性別による違い
性別で分けると女性はとくにノートPCに対して、特定のこれ!というのはないようです。デザインが有意になると考えていただけにかなり意外でした。わたしは女性の方で回収したアンケートは2票だけです。こと伝えで聞きますと、デザイン重視・価格重視で分かれているようです。しかし価格重視といってもやはりデザインの最低限のラインというものがあるんだとか。lenovo think padみたいな無骨なデザインはいくら安くても無理、せめてもう少しカラフルな色という意見なようです。それで分散したようですね。クラスタ分析をすると面白そうです。後日やりましょう。
男のかたは持ち運びやすい・性能、以上終了。
使用頻度による違い
これはかなりわかりやすく、「ヘビーユーザーの場合は性能・持ち運びやすさ重視、ライトユーザーは価格重視」ですね。クロス集計表をみてみましょう。
table(PCdata[c("使用頻度","性別")])
## 性別 ## 使用頻度 1 2 ## 1 17 25 ## 2 26 8 ## 3 18 4 ## 4 3 3 ## 5 6 5
やはり男性の方がPC使用頻度が高いですね。しかし男性でもボリュームゾーンは1時間以上2時間以下ですか…もうすこし4時間以上が多いかと思いましたが…スマートホンのほうをよく使うというのは、いたるところで聞きます。PCは少数派になりつつありますかね
まとめ
繰り返しになりますが今回の質問票から分かったことは以下の通り。
- 「持ち運びやすい」ということはかなり重要
- 「デザイン」は男性でも女性でも有意な相関はない。(満足度なので買う時ぐらいにしか気にしないのかもしれない)
- 「価格」は下宿生は強く意識するものの、実家通いは意識せず(自分で買ってない可能性大)
- 「性能」はやはり意識されるようだ(といっても高性能だと起動が遅いなどはあまりないので、MacBook/surfaceユーザーは気づいてないかも。)
- 「ソフト面」(サポート修理・搭載ソフトなど)は意識されていない。満足要因ではなくても、不満足要因になりうるだろう)
今回初めて自作の質問票でデータを取り、分析しました(今までは政府統計資料とか企業の財務諸表とかばっかり)。聞くべきだった質問が聞けてないとかいろいろ至らないところがあったのは残念ですが、いい経験になりました。次やるときはもっと面白い結果を皆さんにお届けできるよう頑張ります!