University-数学讨论区-Probability and Statistic I, II

斷羽鳥 · 发表于 21-3-2009 02:08 PM

原帖由 TonyDaisie 于 21-3-2009 01:23 PM 发表
我想develop一个polynomial model，有六个variables, 用minitab 或 spss来跑。。。。

请问它的方式是要换去log还是linear的form先吗？？
我从书上找到的只教一个independent variable 而已。。。

把dependent vars plot against each of the independent vars就看得出了。。。

TonyDaisie · 发表于 21-3-2009 02:37 PM

plot了六个graph后，怎样把它们combine成一个model？？

r2和其他的validation都是各别的graph得来的吗？？

我的数学超烂的。。。

斷羽鳥 · 发表于 21-3-2009 02:48 PM

原帖由 TonyDaisie 于 21-3-2009 02:37 PM 发表
plot了六个graph后，怎样把它们combine成一个model？？

r2和其他的validation都是各别的graph得来的吗？？

我的数学超烂的。。。

全部放进去啦。。。Y = ? + ? + ? + ? + ? + ? ....
? ＝你的每个independent variable lah ...

TonyDaisie · 发表于 21-3-2009 03:29 PM

哦。。。。。。

TonyDaisie · 发表于 21-3-2009 03:49 PM

Y = K(a)b(c)d(e)f

请问这叫什么regression?? 是logarithmic吗？？还是exponential?
b,d,f是superscipt来的。

斷羽鳥 · 发表于 21-3-2009 08:03 PM

原帖由 TonyDaisie 于 21-3-2009 03:49 PM 发表
Y = K(a)b(c)d(e)f

请问这叫什么regression?? 是logarithmic吗？？还是exponential?
b,d,f是superscipt来的。

你的independent variable呢？

TonyDaisie · 发表于 21-3-2009 08:29 PM

a,c,e

射即是空 · 发表于 21-3-2009 10:59 PM

各位好...小弟现在在念大学土木系，刚好有一科statistic，现在正读着。
由于以前中学时期书没念好，statistic的chapter以前每次考试都只背式子就上考场，根本没有去理解过。
现在上了大学，发现我完全不了解statistic，连基本的都不懂。

我可以在这里请教大家关于statistic的问题吗？而且是很Basic的问题...那种中学就应该会的问题，可以吗？

TonyDaisie · 发表于 23-3-2009 02:00 PM

t value算出来的是 negative的话，直接比较 t critical 吗？？
还是用positive 的来比？？？

斷羽鳥 · 发表于 23-3-2009 02:42 PM

原帖由 TonyDaisie 于 23-3-2009 02:00 PM 发表
t value算出来的是 negative的话，直接比较 t critical 吗？？
还是用positive 的来比？？？

看absolute value，你之前那个，我也不懂要叫什么。。。哈哈。总之叫nonlinear regressions应该可以吧！

TonyDaisie · 发表于 23-3-2009 08:04 PM

好，谢谢。。。。。

射即是空 · 发表于 27-3-2009 08:11 PM

既然大家没有反对，我就问咯...希望大家不要笑我

我现在读statistic读到很晕，其实是我理解力差啦...
为什么Mean的符号有份µ,E(X),x_bar, X_bar, 它们的分别在那里？

standard deviation到底是什么意思？
比如说我班上同学平均高度Mean为170cm，standard deviation为10cm
我以前误解为"我班同学高度为170±10cm,所以我班不可能有181cm的同学"
但到后来发现好像不是这样，但到底是怎么样呢？

这题就有一点大学程度,但我还是不明白。
Suppose that n=100 random samples of student from a school were taken and the height（m) measured. A 95%CI on the mean height is 1.49≤µ≤1.82.
翻译：从学校里随机选出100个学生，测量它们的高度。平均高度为1.49≤µ≤1.82，其CI（可信度)为95%.

那是不是说，有95%的chance那个µ会在1.49和1.82之间？

如果说这实验（随机选100学生测高度）重做1000次，理论上是不是会有950次的CI contain true value of µ ?

[ 本帖最后由射即是空于 27-3-2009 08:14 PM 编辑 ]

puangenlun · 发表于 27-3-2009 10:07 PM

为什么Mean的符号有份µ,E(X),x_bar, X_bar, 它们的分别在那里？
E(X)是期望值estimated value，它与X的pdf有关，有时候也记做µ。
x_bar, X_bar通常是指算数平均Arithmetic mean，有时候也代表estimated value

standard deviation到底是什么意思？
定义可以看公式。sd越大，则表示X的出现范围越广，不稳定性越强。

比如说我班上同学平均高度Mean为170cm，standard deviation为10cm
我以前误解为"我班同学高度为170±10cm,所以我班不可能有181cm的同学"
但到后来发现好像不是这样，但到底是怎么样呢？
170±10cm表示Mean为170cm，standard deviation为10cm
根据统计原理，
X在170±10的概率为68.27
X在170±20的概率为95.45
X在170±30的概率为99.73
通常取μ ± 3σ已经可以了
对照第二个问题，想必不稳定性你了解了吧！

那是不是说，有95%的chance那个µ会在1.49和1.82之间？
这个不是这样解释的，但是这样解释的人居多。正确解释为：这个区间以95%的概率覆盖了X。这个解释在bayes统计中有分歧。

如果说这实验（随机选100学生测高度）重做1000次，理论上是不是会有950次的CI contain true value of µ ?
应该是这样。

射即是空 · 发表于 27-3-2009 11:00 PM

Ok...大概明白了

不好意思，还有问题...

我看书是这样写
s²=Σ(x-x_bar)²/（n-1)
σ²=Σ(x-µ ) ²/N
为什么s²是除于n-1，σ²是除于N，n和N的分别又是什么呢？

95%CI的那题，
区间以95%的概率覆盖了X，是不是说这100个学生有95个高度在1.49和1.82之间？

[ 本帖最后由射即是空于 27-3-2009 11:04 PM 编辑 ]

DADDY_MUMMY · 发表于 28-3-2009 03:29 AM

n 是 sample，N 是 population
s² 是sample的Variance, σ² 是population的Variance
那个sample的要除n-1，因为它的1拿来estimate它的Mean。。。

不是95个，而是我们有95%的信心相信那100个学生高度在1.49和1.82之间。。

有错请纠正

iamverynoob · 发表于 28-3-2009 01:44 PM

s^2的denominator是n-1是有原因的
s^2是个sample statistics，也是个estimator
我们要找到unbiased estimator of sigma^2 (即是我们找到出来的s^2)，让expected value of estimator = true parameter value
也就是 E(s^2) = sigma^2

考虑 sum (X - X bar)^2 = sum(X^2) - 2(sumX)*Xbar + sum(Xbar)^2 = sum(X^2) - 2sumX*(sumX/n) + n*(sumX/n)^2 = sum(X^2) - n(sumX/n)^2

得E(sum (X - X bar)^2) = nE(X^2) - nE((Xbar)^2)

我们知道 E(X^2) = var(X) + [E(X)]^2 = sigma^2 + mu^2
by central limiting theorem, X bar ~ N (mu, sigma^2/n)
E(Xbar)^2 = sigma^2/n + mu^2

得 E(sum (X - X bar)^2) = n(sigma^2+mu^2) - n(sigma^2/n + mu^2) = (n-1)sigma^2

所以 E(sum(X - X bar)^2/(n-1)) = sigma^2

那个estimator of sigma^2, s^2 = sum(X - X bar)^2 / (n-1)

至于那个confidence interval.我的了解是酱
我们有95%的信心那个POPULATION MEAN会在两个号码之间

汉王 · 发表于 5-4-2009 07:16 PM

现在读到regression才知道原来stat和matrix有点关连！但又不懂！regression很多formula都不理解怎样来的！有点晕咯，难到要看死背？最讨厌背书的了！除了背，各位还有什么方法吗？

yusin · 发表于 15-5-2009 08:33 PM

As a general rule, an observation is considered an extreme value if its Z score is less than - 3
请问是对还是错呀？

The probability that a standard normal random variable, Z, is between 1.50 and 2.10 is the same as the probability Z is between -2.10 and -1.50.
到底是对还是错呢？我自己觉得是对的，可是不确定~

For sample size 16, the sampling distribution of the mean will be approximately normally distributed ____.
a) regardless of the shape of the population （个人觉得n>30才可以选这个）
b)if the shape of the population is symmetrical
c) if the sample standard deviation is known
d) if the sample is normally distributed
我觉得是b)可是不确定~

各位大大~请帮忙~

DADDY_MUMMY · 发表于 16-5-2009 06:47 PM

原帖由 yusin 于 15-5-2009 08:33 PM 发表
As a general rule, an observation is considered an extreme value if its Z score is less than - 3
请问是对还是错呀？

The probability that a standard normal random variable, Z, is between 1.50 ...

第1的我不知道，抱歉。

第2的，我的答案和你一样。

第3的，我的答案也和你一样。

乙劍真人 · 发表于 18-5-2009 11:50 AM

原帖由 yusin 于 15-5-2009 08:33 PM 发表
As a general rule, an observation is considered an extreme value if its Z score is less than - 3
请问是对还是错呀？

应该错吧..

Z score > +- 2 = outlier

extreme value 比 outlier 远..

		自动登录	找回密码
密码			注册

University-数学讨论区-Probability and Statistic I, II

回复 101# 斷羽鳥的帖子

回复 103# 斷羽鳥的帖子

回复 106# 斷羽鳥的帖子

回复 110# 斷羽鳥的帖子

回复 114# 射即是空的帖子

求助3题~

所属分类: 资讯科技

浏览过的版块

University-数学讨论区-Probability and Statistic I, II

回复 101# 斷羽鳥 的帖子

回复 103# 斷羽鳥 的帖子

回复 106# 斷羽鳥 的帖子

回复 110# 斷羽鳥 的帖子

回复 114# 射即是空 的帖子

求助3题~

所属分类: 资讯科技

浏览过的版块

回复 101# 斷羽鳥的帖子

回复 103# 斷羽鳥的帖子

回复 106# 斷羽鳥的帖子

回复 110# 斷羽鳥的帖子

回复 114# 射即是空的帖子