統計ソフトRの初心者です。
統計ソフトRの初心者です。
今、回帰分析について勉強しているんですけど
わからないことがあるので教えてください!!
問題としては平均の信頼区間と予測区間を散布図上にプロットせよ。
と言う問題です。ここまでの問題で書いたプログラムは以下のとおりです。平均の信頼区間、予測区間自体は求めることができたんですけど
それを散布図上にプロットするやり方がわかりません。
詳しい方お願いします!!
> boats=c(447,460,481,498,512,513,526,559,585,614,645,675,711,719,727)
> manatee=c(13,21,24,16,24,20,15,34,33,33,39,43,50,47,54)
> plot(boats,manatee)
> cor(boats,manatee)
[1] 0.9512923
> out=lm(boats~manatee)
> summary(out)
Call:
lm(formula = boats ~ manatee)
Residuals:
Min 1Q Median 3Q Max
-48.069 -13.850 1.090 18.110 59.692
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 361.9077 21.0430 17.20 2.53e-10 ***
manatee 6.9601 0.6256 11.13 5.15e-08 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 31.25 on 13 degrees of freedom
Multiple R-Squared: 0.905, Adjusted R-squared: 0.8976
F-statistic: 123.8 on 1 and 13 DF, p-value: 5.15e-08
> abline(lsfit(boats,manatee)$coef)
> anova(out)
Analysis of Variance Table
Response: boats
Df Sum Sq Mean Sq F value Pr(>F)
manatee 1 120860 120860 123.78 5.15e-08 ***
Residuals 13 12693 976
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> boats.new=1
> predict1=predict(out,data.frame(boats=boats.new),interval="predict",level=0.95)
Warning message:
'newdata' had 1 rows but variable(s) found have 15 rows
> predict1
fit lwr upr
1 452.3884 378.5162 526.2606
2 508.0688 437.0336 579.1041
3 528.9490 458.5776 599.3203
4 473.2685 400.6356 545.9015
5 528.9490 458.5776 599.3203
6 501.1088 429.8023 572.4152
7 466.3085 393.2852 539.3318
8 598.5495 528.7167 668.3823
9 591.5894 521.8203 661.3586
10 591.5894 521.8203 661.3586
11 633.3497 562.8099 703.8896
12 661.1900 589.6287 732.7512
13 709.9103 635.6428 784.1779
14 689.0302 616.0602 762.0001
15 737.7505 661.4514 814.0497
> predict2=predict(out,data.frame(boats=boats.new),interval="confidence",level=0.95)
Warning message:
'newdata' had 1 rows but variable(s) found have 15 rows
> predict2
fit lwr upr
1 452.3884 422.3884 482.3884
2 508.0688 485.9576 530.1800
3 528.9490 509.0738 548.8241
4 473.2685 446.4648 500.0723
5 528.9490 509.0738 548.8241
6 501.1088 478.1413 524.0762
7 466.3085 438.4642 494.1528
8 598.5495 580.6743 616.4247
9 591.5894 573.9646 609.2142
10 591.5894 573.9646 609.2142
11 633.3497 612.8860 653.8135
12 661.1900 637.4431 684.9368
13 709.9103 678.9496 740.8711
14 689.0302 661.3261 716.7342
15 737.7505 702.1914 773.3097
お礼
回答ありがとうございます。 (2)について… 「Coefficients:」の「Estimate」がそれぞれの係数であることはわかるのですが、どのように答えればよいのかが分からなくて… ただ単に(1)のRの結果より、SO2=a+b×Temp・・・を行列式であらわして終わりでよいのでしょうか?? (3)について・・・ 自由度調整済み寄与率は「Adjusted R-squared:」より、0.9095 であることはわかるのですが、この値から(1)で求められた回帰式の性能について言えることが何なのかわからなかったのです。 >寄与率は1に近いほどよい回帰式が得られたことになります。 とのことですが、どのような基準で近いとかの判断をすればよいのでしょうか?? あと、「Multiple R-squared」は寄与率ですが、寄与率と自由度調整済寄与率の違いとは何なのでしょうか?? ご指導よろしくお願いします。