|
University-数学讨论区-Probability and Statistic I, II
[复制链接]
|
|
发表于 21-3-2009 02:08 PM
|
显示全部楼层
原帖由 TonyDaisie 于 21-3-2009 01:23 PM 发表 
我想develop一个polynomial model,有六个variables, 用minitab 或 spss来跑。。。。
请问它的方式是要换去log还是linear的form先吗??
我从书上找到的只教一个independent variable 而已。。。
把dependent vars plot against each of the independent vars就看得出了 。。。 |
|
|
|
|
|
|
|
发表于 21-3-2009 02:37 PM
|
显示全部楼层
回复 101# 斷羽鳥 的帖子
plot了六个graph后,怎样把它们combine成一个model??
r2和其他的validation都是各别的graph得来的吗??
我的数学超烂的。。。  |
|
|
|
|
|
|
|
发表于 21-3-2009 02:48 PM
|
显示全部楼层
|
|
|
|
|
|
|
发表于 21-3-2009 03:29 PM
|
显示全部楼层
回复 103# 斷羽鳥 的帖子
哦。。。。。。  |
|
|
|
|
|
|
|
发表于 21-3-2009 03:49 PM
|
显示全部楼层
Y = K(a)b(c)d(e)f
请问这叫什么regression?? 是logarithmic吗??还是exponential?
b,d,f是superscipt来的。 |
|
|
|
|
|
|
|
发表于 21-3-2009 08:03 PM
|
显示全部楼层
原帖由 TonyDaisie 于 21-3-2009 03:49 PM 发表 
Y = K(a)b(c)d(e)f
请问这叫什么regression?? 是logarithmic吗??还是exponential?
b,d,f是superscipt来的。
你的independent variable呢? |
|
|
|
|
|
|
|
发表于 21-3-2009 08:29 PM
|
显示全部楼层
回复 106# 斷羽鳥 的帖子
a,c,e
 |
|
|
|
|
|
|
|
发表于 21-3-2009 10:59 PM
|
显示全部楼层
各位好...小弟现在在念大学土木系,刚好有一科statistic,现在正读着。
由于以前中学时期书没念好,statistic的chapter以前每次考试都只背式子就上考场,根本没有去理解过。
现在上了大学,发现我完全不了解statistic,连基本的都不懂。
我可以在这里请教大家关于statistic的问题吗?而且是很Basic的问题...那种中学就应该会的问题,可以吗? |
|
|
|
|
|
|
|
发表于 23-3-2009 02:00 PM
|
显示全部楼层
t value算出来的是 negative的话,直接比较 t critical 吗??
还是用positive 的来比??? |
|
|
|
|
|
|
|
发表于 23-3-2009 02:42 PM
|
显示全部楼层
原帖由 TonyDaisie 于 23-3-2009 02:00 PM 发表 
t value算出来的是 negative的话,直接比较 t critical 吗??
还是用positive 的来比???
看absolute value, 你之前那个, 我也不懂要叫什么 。。。哈哈。总之叫nonlinear regressions应该可以吧! |
|
|
|
|
|
|
|
发表于 23-3-2009 08:04 PM
|
显示全部楼层
回复 110# 斷羽鳥 的帖子
好,谢谢。。。。。  |
|
|
|
|
|
|
|
发表于 27-3-2009 08:11 PM
|
显示全部楼层
既然大家没有反对,我就问咯...希望大家不要笑我
我现在读statistic读到很晕,其实是我理解力差啦...
为什么Mean的符号有份µ,E(X),x_bar, X_bar, 它们的分别在那里?
standard deviation到底是什么意思?
比如说我班上同学平均高度Mean为170cm,standard deviation为10cm
我以前误解为"我班同学高度为170±10cm,所以我班不可能有181cm的同学"
但到后来发现好像不是这样,但到底是怎么样呢?
这题就有一点大学程度,但我还是不明白。
Suppose that n=100 random samples of student from a school were taken and the height(m) measured. A 95%CI on the mean height is 1.49≤µ≤1.82.
翻译:从学校里随机选出100个学生,测量它们的高度。平均高度为1.49≤µ≤1.82,其CI(可信度)为95%.
那是不是说,有95%的chance那个µ会在1.49和1.82之间?
如果说这实验(随机选100学生测高度)重做1000次,理论上是不是会有950次的CI contain true value of µ ?
[ 本帖最后由 射即是空 于 27-3-2009 08:14 PM 编辑 ] |
|
|
|
|
|
|
|
发表于 27-3-2009 10:07 PM
|
显示全部楼层
为什么Mean的符号有份µ,E(X),x_bar, X_bar, 它们的分别在那里?
E(X)是期望值estimated value,它与X的pdf有关,有时候也记做µ。
x_bar, X_bar通常是指算数平均Arithmetic mean,有时候也代表estimated value
standard deviation到底是什么意思?
定义可以看公式。sd越大,则表示X的出现范围越广,不稳定性越强。
比如说我班上同学平均高度Mean为170cm,standard deviation为10cm
我以前误解为"我班同学高度为170±10cm,所以我班不可能有181cm的同学"
但到后来发现好像不是这样,但到底是怎么样呢?
170±10cm表示Mean为170cm,standard deviation为10cm
根据统计原理,
X在170±10的概率为68.27
X在170±20的概率为95.45
X在170±30的概率为99.73
通常取μ ± 3σ已经可以了
对照第二个问题,想必不稳定性你了解了吧!
那是不是说,有95%的chance那个µ会在1.49和1.82之间?
这个不是这样解释的,但是这样解释的人居多。正确解释为:这个区间以95%的概率覆盖了X。这个解释在bayes统计中有分歧。
如果说这实验(随机选100学生测高度)重做1000次,理论上是不是会有950次的CI contain true value of µ ?
应该是这样。 |
|
|
|
|
|
|
|
发表于 27-3-2009 11:00 PM
|
显示全部楼层
Ok...大概明白了
不好意思,还有问题...
我看书是这样写
s²=Σ(x-x_bar)²/(n-1)
σ²=Σ(x-µ ) ²/N
为什么s²是除于n-1,σ²是除于N,n和N的分别又是什么呢?
95%CI的那题,
区间以95%的概率覆盖了X,是不是说这100个学生有95个高度在1.49和1.82之间?
[ 本帖最后由 射即是空 于 27-3-2009 11:04 PM 编辑 ] |
|
|
|
|
|
|
|
发表于 28-3-2009 03:29 AM
|
显示全部楼层
n 是 sample,N 是 population
s² 是sample的Variance, σ² 是population的Variance
那个sample的要除n-1,因为它的1拿来estimate它的Mean。。。
不是95个,而是我们有95%的信心相信那100个学生高度在1.49和1.82之间。。
有错请纠正 |
|
|
|
|
|
|
|
发表于 28-3-2009 01:44 PM
|
显示全部楼层
回复 114# 射即是空 的帖子
s^2的denominator是n-1是有原因的
s^2是个sample statistics,也是个estimator
我们要找到unbiased estimator of sigma^2 (即是我们找到出来的s^2),让expected value of estimator = true parameter value
也就是 E(s^2) = sigma^2
考虑 sum (X - X bar)^2 = sum(X^2) - 2(sumX)*Xbar + sum(Xbar)^2 = sum(X^2) - 2sumX*(sumX/n) + n*(sumX/n)^2 = sum(X^2) - n(sumX/n)^2
得E(sum (X - X bar)^2) = nE(X^2) - nE((Xbar)^2)
我们知道 E(X^2) = var(X) + [E(X)]^2 = sigma^2 + mu^2
by central limiting theorem, X bar ~ N (mu, sigma^2/n)
E(Xbar)^2 = sigma^2/n + mu^2
得 E(sum (X - X bar)^2) = n(sigma^2+mu^2) - n(sigma^2/n + mu^2) = (n-1)sigma^2
所以 E(sum(X - X bar)^2/(n-1)) = sigma^2
那个estimator of sigma^2, s^2 = sum(X - X bar)^2 / (n-1)
至于那个confidence interval.我的了解是酱
我们有95%的信心那个POPULATION MEAN会在两个号码之间 |
|
|
|
|
|
|
|
发表于 5-4-2009 07:16 PM
|
显示全部楼层
现在读到regression才知道原来stat和matrix有点关连!但又不懂!regression很多formula都不理解怎样来的!有点晕咯,难到要看死背?最讨厌背书的了!除了背,各位还有什么方法吗?  |
|
|
|
|
|
|
|
发表于 15-5-2009 08:33 PM
|
显示全部楼层
求助3题~
As a general rule, an observation is considered an extreme value if its Z score is less than - 3
请问是对还是错呀?
The probability that a standard normal random variable, Z, is between 1.50 and 2.10 is the same as the probability Z is between -2.10 and -1.50.
到底是对还是错呢?我自己觉得是对的,可是不确定~
For sample size 16, the sampling distribution of the mean will be approximately normally distributed ____.
a) regardless of the shape of the population (个人觉得n>30才可以选这个)
b)if the shape of the population is symmetrical
c) if the sample standard deviation is known
d) if the sample is normally distributed
我觉得是b)可是不确定~
各位大大~请帮忙~ |
|
|
|
|
|
|
|
发表于 16-5-2009 06:47 PM
|
显示全部楼层
原帖由 yusin 于 15-5-2009 08:33 PM 发表 
As a general rule, an observation is considered an extreme value if its Z score is less than - 3
请问是对还是错呀?
The probability that a standard normal random variable, Z, is between 1.50 ...
第1的我不知道,抱歉。
第2的,我的答案和你一样。
第3的,我的答案也和你一样。
 |
|
|
|
|
|
|
|
发表于 18-5-2009 11:50 AM
|
显示全部楼层
原帖由 yusin 于 15-5-2009 08:33 PM 发表 
As a general rule, an observation is considered an extreme value if its Z score is less than - 3
请问是对还是错呀?
应该错吧..
Z score > +- 2 = outlier
extreme value 比 outlier 远.. |
|
|
|
|
|
|
| |
本周最热论坛帖子
|