Lab 02: Statistical Hypothesis Testing: The Student’s t-distribution and the related test

Feedback should be send to goran.milovanovic@datakolektiv.com. These notebooks accompany the Intro to Data Science: Non-Technical Background course 2020/21.

What do we want to do today?

We will introduce the conceptual and mathematical framework of Statistical Hypothesis Testing by studying a very important test: the t-test. Of all its variations, we will study only one, the simplest, in which we ask the following question: does the sample mean from a Normal distribution differ from some hypothesized population mean, or not?

0. Setup

library(tidyverse)

Warning message:
package ‘RMariaDB’ was built under R version 4.0.4

library(data.table)
set.seed(9988)

1. The Student’s t-distribution

We begin by defining one Normal distribution with mean == 10 and variance == 5. We draw 100,000 samples of size == 1000 from it, obtain the mean for each sample, and visualize the distribution of the sample mean.

# - number of samples
nsamples = 100000
# - sample size
n = 1000
# - normal parameters
# - mean:
mu = 10
# - variance:
sigma2 = 5
# - standard deviation:
std_dev = sqrt(sigma2)
# - n random draws from Normal(mu, std_dev), sample size = 1000, 
# - take the mean *and the variance* of each sample:
normalSamples <- lapply(1:nsamples, function(x) {
  sp <- rnorm(n, mu, std_dev)
  m <- mean(sp)
  v <- var(sp)
  return(
    data.frame(mean = m,
               variance = v)
  )
})
# - remember data.table::rbindlist from Session09?
normalSamples <- rbindlist(normalSamples)
# - The distribution of sample means:
ggplot(normalSamples, 
       aes(x = mean)) + 
  geom_histogram(binwidth = .001, 
                 fill = 'darkred', 
                 color = 'darkred') +
  ggtitle("The sampling distribution of the mean") + 
  theme_bw() + 
  theme(panel.border = element_blank()) + 
  theme(plot.title = element_text(hjust = .5))

Consider the following variable:

\[t = \frac{\overline{X} - \mu}{{S}/{\sqrt{n}}}\]

where \(\overline{X}\) is the sample mean, \(\mu\) the population mean, \(S\) the standard deviation, and \(n\) the sample size. This quantity is known to follow a t-distribution with \(n-1\) degrees of freedom:

tdist <- (normalSamples$mean - mu)/(sqrt(normalSamples$variance)/sqrt(n))
tdist <- data.frame(t = tdist)
# - The Student's t-distribution:
ggplot(tdist, 
       aes(x = t)) + 
  geom_histogram(binwidth = .001, 
                 fill = 'darkorange', 
                 color = 'darkorange') +
  ggtitle("The Student's t-distribution") + 
  theme_bw() + 
  theme(panel.border = element_blank()) + 
  theme(plot.title = element_text(hjust = .5))

The probability density function of the t-distribution presents a really nice exercise in \(LaTeX\):

\[f(t)=\frac{\Gamma(\frac{\nu+1}{2})}{\sqrt(\nu\pi)\Gamma(\frac{\nu}{2})}(1 + \frac{t^2}{\nu})^{-\frac{\nu+1}{2}}\] where \(\nu\) represents the degrees of freedom, and \(\Gamma\) is the Gamma function (just forget about it).

2. The t-test

Assume that we want to test if a mean of a sample drawn from some (presumably) Normal distribution is different than zero. We do not care if it is larger or not than zero, we just want to test if it is zero or not (or, in the lingo of mathematical statistics: if it statistically different from zero). I will use a Normal distribution with mean == 10 and variance == 5 to draw a sample from and then ask: is the sample mean significantly different from zero?

# - population (test) mean
real_mean <- 0
# - sample size
n = 10000
# - normal parameters
# - mean:
mu = 10
# - variance:
sigma2 = 5
# - standard deviation:
std_dev = sqrt(sigma2)
# - one random draw from Normal(mu, std_dev), sample size = n, 
# - and take the mean
normalSample <- rnorm(n, mu, std_dev)
sample_mean <- mean(normalSample)
print(paste0("The sample mean is: ", sample_mean))

[1] "The sample mean is: 10.0274701328529"

sample_std_dev <- sd(normalSample)
print(paste0("The standard deviation is: ", sample_std_dev))

[1] "The standard deviation is: 2.22917426175989"

# - test statistic:
tStatistic <- (sample_mean - real_mean)/(sample_std_dev/sqrt(n))
print(paste0("The t-statistic is: ", tStatistic))

[1] "The t-statistic is: 449.828903234168"

# - degrees of freedom:
df <- n - 1
print(paste0("The number of degrees of freedom is: ", df))

[1] "The number of degrees of freedom is: 9999"

Now, let’s take a look again at:

\[t = \frac{\overline{X} - \mu}{{S}/{\sqrt{n}}}\]

We know that in our current experiment \(\overline{X}\) is around 10.00, \(\mu\) - the population mean - is zero (because we want to test against zero), \(S\) is around 2.24, and \(n\) is 10,000, and we also know that this quantity follows a t-distribution with \(n-1\) degrees of freedom. What is the probability of obtaining the value of \(t\) of 447.58 from a t-distribution with 9,999 degrees of freedom?

2.1 The probability of obtaining some t-test statistic from a t-distribution

This might confuse you:

pt(abs(tStatistic), df, lower.tail = FALSE) * 2

[1] 0

But it is really easy: pt() is the cumulative probability function for the t-distribution in R (remember the dpqr notations: dt() is its probability density function, pt() the cumulative distribution function, qt() its quantile function, and rt() its random number generator, similar to dnorm(), pnorm(), qnorm(), and rnorm()). But why did we multiply the probability of observing the value of the tStatistic from a t-distribution with df degrees of freedom by two? Because we do not care if the sample mean that we are testing against zero is lower than zero or higher than zero - so we have to consider the possibility of obtaining a positive as well a as a negative value of the t-test statistic!

Of course, R has a handy t.test() function to perform t-tests…

t.test(normalSample, mu = real_mean, alternative = "two.sided")


    One Sample t-test

data:  normalSample
t = 449.83, df = 9999, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
  9.983774 10.071166
sample estimates:
mean of x 
 10.02747

Hint. Think: alternative = "two.sided" in the t.test() call above. Please: study the documentation, read something about the t-test, and figure out for yourself - it is easy - why can we have (and what sense does it make to have) both alternative = "two.sided", alternative = "less" and alternative = "greater"!

To test any sample mean against any hypothesized population value - just change the real_mean value in the code above. It does not have to zero, of course:

t.test(normalSample, mu = 9.98, alternative = "two.sided")


    One Sample t-test

data:  normalSample
t = 2.1295, df = 9999, p-value = 0.03324
alternative hypothesis: true mean is not equal to 9.98
95 percent confidence interval:
  9.983774 10.071166
sample estimates:
mean of x 
 10.02747

Or, by hand:

# - population (test) mean
real_mean <- 9.98
# - sample size
n = 10000
# - normal parameters
# - mean:
mu = 10
# - variance:
sigma2 = 5
# - standard deviation:
std_dev = sqrt(sigma2)
# - one random draw from Normal(mu, std_dev), sample size = n, 
# - and take the mean
normalSample <- rnorm(n, mu, std_dev)
# - test statistic:
tStatistic <- (sample_mean - real_mean)/(sample_std_dev/sqrt(n))
print(paste0("The t-statistic is: ", tStatistic))

[1] "The t-statistic is: 2.12949403136401"

# - degrees of freedom:
df <- n - 1
print(paste0("The number of degrees of freedom is: ", df))

[1] "The number of degrees of freedom is: 9999"

# - p-value
pvalue <- pt(abs(tStatistic), df, lower.tail = FALSE) * 2
print(paste0("The p-value is: ", pvalue))

[1] "The p-value is: 0.0332377653132108"

Remember: p-value < .05 is the conventional value - well, one of the two conventional values, the other being .01 - beyond which we call the result of statistical hypothesis testing significant. Let’s discuss the interpretation of this probability in exact terms.

2.2 Statistical Hypothesis Testing: the null and the alternative hypothesis

First, let’s take a look at the t-test statistic once again:

\[t = \frac{\overline{X} - \mu}{{S}/{\sqrt{n}}}\]

What we can say about it that it really represents the difference between the sample mean \(\overline{X}\) and the hypothesized population mean \(\mu\), scaled by \({S}/{\sqrt{n}}\). The scaling is present only to make the difference follow the t-distribution. Now, let’s take a look at the t-distribution again:

# - The Student's t-distribution:
ggplot(tdist, 
       aes(x = t)) + 
  geom_histogram(binwidth = .001, 
                 fill = 'darkorange', 
                 color = 'darkorange') +
  ggtitle("The Student's t-distribution") + 
  theme_bw() + 
  theme(panel.border = element_blank()) + 
  theme(plot.title = element_text(hjust = .5))

and note that its mean is zero (yes, you are looking at the result of a numerical simulation, but trust me: it is zero). So the probability density around zero is very high. Let’s assume now that we expect to see no difference between the sample mean and the population mean: we expect to observe a t-test statistic of zero or close to zero. We call this assumption the null hypothesis in statistical hypothesis testing, and note how the t-distribution, centered around zero, nicely represents the belief that there is no difference between the sample mean and the population mean!

Now, the rejection of the null hypothesis is called an alternative hypothesis, which is very simple in the t-test: it states that sample mean is really different from the population mean. Ok, how do we know when to reject the null hypothesis and when not? Simply put, by doing:

pt(abs(tStatistic), df, lower.tail = FALSE) * 2

which will tell us what is the probability that a given value of the t-test statistic is obtained from a distribution that represents our null hypothesis. So, if this probability - the p-value in the output of t.test() - is low, we understand that it is unlikely that we have observed the value of the t-test that we have computed from our sample if the sample mean was obtained from a population with a hypothesized (test) mean. And then, by convention, we say: if that probability is lower than .05, the finding is called statistically significant.

The p-value is a probability of committing to a Type I Error (a.k.a. “a false positive”) in statistics: to reject a null hypothesis when a null hypothesis is indeed true. If you do this that would be the same as to claim that some result is significant while in fact it occurred by chance.

2.3 Building an intuition on the value of a t-test, the respective p-value, and the sample size

Remember that we have used the population mean of real_mean == 0 and then drawn a sample from a Normal with a mean of mu == 10 and variance of sigma2 = 5 to exemplify the t-test? Let’s see what happens if we vary the sample mean as c(10, 5, 1, .5, .1, .01, .001, .0001):

options(scipen = 999)
# - population (test) mean
real_mean <- 0
# - sample size
n = 10000
# - normal parameters
# - mean:
mu = c(10, 5, 1, .5, .1, .01, .001, .0001)
# - variance:
sigma2 = 5
# - standard deviation:
std_dev = sqrt(sigma2)
# - random draws from Normal(mu, std_dev), sample size = n, 
# - and then take the mean
t_tests <- lapply(mu, function(x) {
  test_sample <- rnorm(n, x, std_dev)
  test_result <- t.test(test_sample, mu = real_mean, alternative = "two.sided")
  return(
    data.frame(sample_mean = x,
               population_mean = real_mean,
               t = round(test_result$statistic, 3),
               p = round(test_result$p.value, 3)
               )
  )
})
t_tests <- rbindlist(t_tests)
print(t_tests)

So, when the sample mean was taken to be .01 and lower, the t-test was not able to differentiate it from zero anymore - given the sample size of n = 10000 that we used. Please observe how the value of the t-test statistic decreased with a decrease in the difference between the sample and the population mean, and how at the same time the probability of obtaining a particular value of the t-test from a t-distribution that represents the null hypothesis increased. What happens if we set the sample size, n, to one million?

options(scipen = 999)
# - population (test) mean
real_mean <- 0
# - sample size
n = 1e06
# - normal parameters
# - mean:
mu = c(10, 5, 1, .5, .1, .01, .001, .0001)
# - variance:
sigma2 = 5
# - standard deviation:
std_dev = sqrt(sigma2)
# - random draws from Normal(mu, std_dev), sample size = n, 
# - and then take the mean
t_tests <- lapply(mu, function(x) {
  test_sample <- rnorm(n, x, std_dev)
  test_result <- t.test(test_sample, mu = real_mean, alternative = "two.sided")
  return(
    data.frame(sample_mean = x,
               population_mean = real_mean,
               t = round(test_result$statistic, 3),
               p = round(test_result$p.value, 3)
               )
  )
})
t_tests <- rbindlist(t_tests)
print(t_tests)

Now we needed to reach the value of the sample_mean == 0.001 for the t-test to be unable to tell that it is statistically significantly different from zero. Do not forget about this exercise ever.

R Markdown

R Markdown is what I have used to produce this beautiful Notebook. We will learn more about it near the end of the course, but if you already feel ready to dive deep, here’s a book: R Markdown: The Definitive Guide, Yihui Xie, J. J. Allaire, Garrett Grolemunds.

Goran S. Milovanović

DataKolektiv, 2020/21

contact: goran.milovanovic@datakolektiv.com

License: GPLv3 This Notebook is free software: you can redistribute it and/or modify it under the terms of the GNU General Public License as published by the Free Software Foundation, either version 3 of the License, or (at your option) any later version. This Notebook is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License for more details. You should have received a copy of the GNU General Public License along with this Notebook. If not, see http://www.gnu.org/licenses/.

LS0tDQp0aXRsZTogSW50cm8gdG8gRGF0YSBTY2llbmNlIChOb24tVGVjaG5pY2FsIEJhY2tncm91bmQsIFIpIC0gTGFiMDINCmF1dGhvcjoNCi0gbmFtZTogR29yYW4gUy4gTWlsb3Zhbm92acSHLCBQaEQNCiAgYWZmaWxpYXRpb246IERhdGFLb2xla3RpdiwgQ2hpZWYgU2NpZW50aXN0ICYgT3duZXI7IERhdGEgU2NpZW50aXN0IGZvciBXaWtpZGF0YSwgV01ERQ0KYWJzdHJhY3Q6IA0Kb3V0cHV0Og0KICBodG1sX25vdGVib29rOg0KICAgIGNvZGVfZm9sZGluZzogc2hvdw0KICAgIHRoZW1lOiBzcGFjZWxhYg0KICAgIHRvYzogeWVzDQogICAgdG9jX2Zsb2F0OiB5ZXMNCiAgICB0b2NfZGVwdGg6IDUNCiAgaHRtbF9kb2N1bWVudDoNCiAgICB0b2M6IHllcw0KICAgIHRvY19kZXB0aDogNQ0KLS0tDQoNCiFbXSguLi9faW1nL0RLX0xvZ29fMTAwLnBuZykNCg0KKioqDQojIExhYiAwMjogU3RhdGlzdGljYWwgSHlwb3RoZXNpcyBUZXN0aW5nOiBUaGUgU3R1ZGVudCdzIHQtZGlzdHJpYnV0aW9uIGFuZCB0aGUgcmVsYXRlZCB0ZXN0DQogDQoqKkZlZWRiYWNrKiogc2hvdWxkIGJlIHNlbmQgdG8gYGdvcmFuLm1pbG92YW5vdmljQGRhdGFrb2xla3Rpdi5jb21gLiANClRoZXNlIG5vdGVib29rcyBhY2NvbXBhbnkgdGhlIEludHJvIHRvIERhdGEgU2NpZW5jZTogTm9uLVRlY2huaWNhbCBCYWNrZ3JvdW5kIGNvdXJzZSAyMDIwLzIxLg0KDQoqKioNCg0KIyMjIFdoYXQgZG8gd2Ugd2FudCB0byBkbyB0b2RheT8NCg0KV2Ugd2lsbCBpbnRyb2R1Y2UgdGhlIGNvbmNlcHR1YWwgYW5kIG1hdGhlbWF0aWNhbCBmcmFtZXdvcmsgb2YgU3RhdGlzdGljYWwgSHlwb3RoZXNpcyBUZXN0aW5nIGJ5IHN0dWR5aW5nIGEgdmVyeSBpbXBvcnRhbnQgdGVzdDogdGhlICoqdC10ZXN0KiouIE9mIGFsbCBpdHMgdmFyaWF0aW9ucywgd2Ugd2lsbCBzdHVkeSBvbmx5IG9uZSwgdGhlIHNpbXBsZXN0LCBpbiB3aGljaCB3ZSBhc2sgdGhlIGZvbGxvd2luZyBxdWVzdGlvbjogZG9lcyB0aGUgc2FtcGxlIG1lYW4gZnJvbSBhIE5vcm1hbCBkaXN0cmlidXRpb24gZGlmZmVyIGZyb20gc29tZSBoeXBvdGhlc2l6ZWQgcG9wdWxhdGlvbiBtZWFuLCBvciBub3Q/DQoNCiMjIyAwLiBTZXR1cA0KDQpgYGB7ciBlY2hvID0gVCwgbWVzc2FnZSA9IEYsIHdhcm5pbmcgPSBGfQ0KbGlicmFyeSh0aWR5dmVyc2UpDQpsaWJyYXJ5KGRhdGEudGFibGUpDQpzZXQuc2VlZCg5OTg4KQ0KYGBgDQoNCiMjIyAxLiBUaGUgU3R1ZGVudCdzIHQtZGlzdHJpYnV0aW9uDQoNCldlIGJlZ2luIGJ5IGRlZmluaW5nIG9uZSBOb3JtYWwgZGlzdHJpYnV0aW9uIHdpdGggYG1lYW4gPT0gMTBgIGFuZCBgdmFyaWFuY2UgPT0gNWAuIFdlIGRyYXcgMTAwLDAwMCBzYW1wbGVzIG9mIGBzaXplID09IDEwMDBgIGZyb20gaXQsIG9idGFpbiB0aGUgbWVhbiBmb3IgZWFjaCBzYW1wbGUsIGFuZCB2aXN1YWxpemUgdGhlIGRpc3RyaWJ1dGlvbiBvZiB0aGUgc2FtcGxlIG1lYW4uDQoNCmBgYHtyIGVjaG8gPSBUfQ0KIyAtIG51bWJlciBvZiBzYW1wbGVzDQpuc2FtcGxlcyA9IDEwMDAwMA0KIyAtIHNhbXBsZSBzaXplDQpuID0gMTAwMA0KIyAtIG5vcm1hbCBwYXJhbWV0ZXJzDQojIC0gbWVhbjoNCm11ID0gMTANCiMgLSB2YXJpYW5jZToNCnNpZ21hMiA9IDUNCiMgLSBzdGFuZGFyZCBkZXZpYXRpb246DQpzdGRfZGV2ID0gc3FydChzaWdtYTIpDQojIC0gbiByYW5kb20gZHJhd3MgZnJvbSBOb3JtYWwobXUsIHN0ZF9kZXYpLCBzYW1wbGUgc2l6ZSA9IDEwMDAsIA0KIyAtIHRha2UgdGhlIG1lYW4gKmFuZCB0aGUgdmFyaWFuY2UqIG9mIGVhY2ggc2FtcGxlOg0Kbm9ybWFsU2FtcGxlcyA8LSBsYXBwbHkoMTpuc2FtcGxlcywgZnVuY3Rpb24oeCkgew0KICBzcCA8LSBybm9ybShuLCBtdSwgc3RkX2RldikNCiAgbSA8LSBtZWFuKHNwKQ0KICB2IDwtIHZhcihzcCkNCiAgcmV0dXJuKA0KICAgIGRhdGEuZnJhbWUobWVhbiA9IG0sDQogICAgICAgICAgICAgICB2YXJpYW5jZSA9IHYpDQogICkNCn0pDQojIC0gcmVtZW1iZXIgZGF0YS50YWJsZTo6cmJpbmRsaXN0IGZyb20gU2Vzc2lvbjA5Pw0Kbm9ybWFsU2FtcGxlcyA8LSByYmluZGxpc3Qobm9ybWFsU2FtcGxlcykNCiMgLSBUaGUgZGlzdHJpYnV0aW9uIG9mIHNhbXBsZSBtZWFuczoNCmdncGxvdChub3JtYWxTYW1wbGVzLCANCiAgICAgICBhZXMoeCA9IG1lYW4pKSArIA0KICBnZW9tX2hpc3RvZ3JhbShiaW53aWR0aCA9IC4wMDEsIA0KICAgICAgICAgICAgICAgICBmaWxsID0gJ2RhcmtyZWQnLCANCiAgICAgICAgICAgICAgICAgY29sb3IgPSAnZGFya3JlZCcpICsNCiAgZ2d0aXRsZSgiVGhlIHNhbXBsaW5nIGRpc3RyaWJ1dGlvbiBvZiB0aGUgbWVhbiIpICsgDQogIHRoZW1lX2J3KCkgKyANCiAgdGhlbWUocGFuZWwuYm9yZGVyID0gZWxlbWVudF9ibGFuaygpKSArIA0KICB0aGVtZShwbG90LnRpdGxlID0gZWxlbWVudF90ZXh0KGhqdXN0ID0gLjUpKQ0KYGBgDQpDb25zaWRlciB0aGUgZm9sbG93aW5nIHZhcmlhYmxlOg0KDQokJHQgPSBcZnJhY3tcb3ZlcmxpbmV7WH0gLSBcbXV9e3tTfS97XHNxcnR7bn19fSQkDQoNCndoZXJlICRcb3ZlcmxpbmV7WH0kIGlzIHRoZSBzYW1wbGUgbWVhbiwgJFxtdSQgdGhlIHBvcHVsYXRpb24gbWVhbiwgJFMkIHRoZSAqc3RhbmRhcmQgZGV2aWF0aW9uKiwgYW5kICRuJCB0aGUgc2FtcGxlIHNpemUuIFRoaXMgcXVhbnRpdHkgaXMga25vd24gdG8gZm9sbG93IGEgKip0LWRpc3RyaWJ1dGlvbioqIHdpdGggJG4tMSQgZGVncmVlcyBvZiBmcmVlZG9tOg0KDQpgYGB7ciBlY2hvID0gVH0NCnRkaXN0IDwtIChub3JtYWxTYW1wbGVzJG1lYW4gLSBtdSkvKHNxcnQobm9ybWFsU2FtcGxlcyR2YXJpYW5jZSkvc3FydChuKSkNCnRkaXN0IDwtIGRhdGEuZnJhbWUodCA9IHRkaXN0KQ0KIyAtIFRoZSBTdHVkZW50J3MgdC1kaXN0cmlidXRpb246DQpnZ3Bsb3QodGRpc3QsIA0KICAgICAgIGFlcyh4ID0gdCkpICsgDQogIGdlb21faGlzdG9ncmFtKGJpbndpZHRoID0gLjAwMSwgDQogICAgICAgICAgICAgICAgIGZpbGwgPSAnZGFya29yYW5nZScsIA0KICAgICAgICAgICAgICAgICBjb2xvciA9ICdkYXJrb3JhbmdlJykgKw0KICBnZ3RpdGxlKCJUaGUgU3R1ZGVudCdzIHQtZGlzdHJpYnV0aW9uIikgKyANCiAgdGhlbWVfYncoKSArIA0KICB0aGVtZShwYW5lbC5ib3JkZXIgPSBlbGVtZW50X2JsYW5rKCkpICsgDQogIHRoZW1lKHBsb3QudGl0bGUgPSBlbGVtZW50X3RleHQoaGp1c3QgPSAuNSkpDQpgYGANClRoZSBwcm9iYWJpbGl0eSBkZW5zaXR5IGZ1bmN0aW9uIG9mIHRoZSB0LWRpc3RyaWJ1dGlvbiBwcmVzZW50cyBhIHJlYWxseSBuaWNlIGV4ZXJjaXNlIGluICRMYVRlWCQ6DQoNCiQkZih0KT1cZnJhY3tcR2FtbWEoXGZyYWN7XG51KzF9ezJ9KX17XHNxcnQoXG51XHBpKVxHYW1tYShcZnJhY3tcbnV9ezJ9KX0oMSArIFxmcmFje3ReMn17XG51fSleey1cZnJhY3tcbnUrMX17Mn19JCQNCndoZXJlICRcbnUkIHJlcHJlc2VudHMgdGhlIGRlZ3JlZXMgb2YgZnJlZWRvbSwgYW5kICRcR2FtbWEkIGlzIHRoZSBbR2FtbWEgZnVuY3Rpb25dKGh0dHBzOi8vZW4ud2lraXBlZGlhLm9yZy93aWtpL0dhbW1hX2Z1bmN0aW9uKSAoanVzdCBmb3JnZXQgYWJvdXQgaXQpLg0KDQoNCiMjIyAyLiBUaGUgdC10ZXN0DQoNCkFzc3VtZSB0aGF0IHdlIHdhbnQgdG8gdGVzdCBpZiBhIG1lYW4gb2YgYSBzYW1wbGUgZHJhd24gZnJvbSBzb21lIChwcmVzdW1hYmx5KSBOb3JtYWwgZGlzdHJpYnV0aW9uIGlzIGRpZmZlcmVudCB0aGFuIHplcm8uIFdlIGRvIG5vdCBjYXJlIGlmIGl0IGlzIGxhcmdlciBvciBub3QgdGhhbiB6ZXJvLCB3ZSBqdXN0IHdhbnQgdG8gdGVzdCBpZiBpdCBpcyB6ZXJvIG9yIG5vdCAob3IsIGluIHRoZSBsaW5nbyBvZiBtYXRoZW1hdGljYWwgc3RhdGlzdGljczogaWYgaXQgKnN0YXRpc3RpY2FsbHkgZGlmZmVyZW50KiBmcm9tIHplcm8pLiBJIHdpbGwgdXNlIGEgTm9ybWFsIGRpc3RyaWJ1dGlvbiB3aXRoIGBtZWFuID09IDEwYCBhbmQgYHZhcmlhbmNlID09IDVgIHRvIGRyYXcgYSBzYW1wbGUgZnJvbSBhbmQgdGhlbiBhc2s6IGlzIHRoZSBzYW1wbGUgbWVhbiBzaWduaWZpY2FudGx5IGRpZmZlcmVudCBmcm9tIHplcm8/DQoNCmBgYHtyIGVjaG8gPSBUfQ0KIyAtIHBvcHVsYXRpb24gKHRlc3QpIG1lYW4NCnJlYWxfbWVhbiA8LSAwDQojIC0gc2FtcGxlIHNpemUNCm4gPSAxMDAwMA0KIyAtIG5vcm1hbCBwYXJhbWV0ZXJzDQojIC0gbWVhbjoNCm11ID0gMTANCiMgLSB2YXJpYW5jZToNCnNpZ21hMiA9IDUNCiMgLSBzdGFuZGFyZCBkZXZpYXRpb246DQpzdGRfZGV2ID0gc3FydChzaWdtYTIpDQojIC0gb25lIHJhbmRvbSBkcmF3IGZyb20gTm9ybWFsKG11LCBzdGRfZGV2KSwgc2FtcGxlIHNpemUgPSBuLCANCiMgLSBhbmQgdGFrZSB0aGUgbWVhbg0Kbm9ybWFsU2FtcGxlIDwtIHJub3JtKG4sIG11LCBzdGRfZGV2KQ0Kc2FtcGxlX21lYW4gPC0gbWVhbihub3JtYWxTYW1wbGUpDQpwcmludChwYXN0ZTAoIlRoZSBzYW1wbGUgbWVhbiBpczogIiwgc2FtcGxlX21lYW4pKQ0Kc2FtcGxlX3N0ZF9kZXYgPC0gc2Qobm9ybWFsU2FtcGxlKQ0KcHJpbnQocGFzdGUwKCJUaGUgc3RhbmRhcmQgZGV2aWF0aW9uIGlzOiAiLCBzYW1wbGVfc3RkX2RldikpDQojIC0gdGVzdCBzdGF0aXN0aWM6DQp0U3RhdGlzdGljIDwtIChzYW1wbGVfbWVhbiAtIHJlYWxfbWVhbikvKHNhbXBsZV9zdGRfZGV2L3NxcnQobikpDQpwcmludChwYXN0ZTAoIlRoZSB0LXN0YXRpc3RpYyBpczogIiwgdFN0YXRpc3RpYykpDQojIC0gZGVncmVlcyBvZiBmcmVlZG9tOg0KZGYgPC0gbiAtIDENCnByaW50KHBhc3RlMCgiVGhlIG51bWJlciBvZiBkZWdyZWVzIG9mIGZyZWVkb20gaXM6ICIsIGRmKSkNCmBgYA0KTm93LCBsZXQncyB0YWtlIGEgbG9vayBhZ2FpbiBhdDoNCg0KJCR0ID0gXGZyYWN7XG92ZXJsaW5le1h9IC0gXG11fXt7U30ve1xzcXJ0e259fX0kJA0KDQpXZSBrbm93IHRoYXQgaW4gb3VyIGN1cnJlbnQgZXhwZXJpbWVudCAkXG92ZXJsaW5le1h9JCBpcyBhcm91bmQgYDEwLjAwYCwgJFxtdSQgLSB0aGUgcG9wdWxhdGlvbiBtZWFuIC0gaXMgKip6ZXJvKiogKGJlY2F1c2Ugd2Ugd2FudCB0byB0ZXN0IGFnYWluc3QgemVybyksICRTJCBpcyBhcm91bmQgYDIuMjRgLCBhbmQgJG4kIGlzIGAxMCwwMDBgLCBhbmQgd2UgYWxzbyBrbm93IHRoYXQgdGhpcyBxdWFudGl0eSBmb2xsb3dzIGEgKip0LWRpc3RyaWJ1dGlvbioqIHdpdGggJG4tMSQgZGVncmVlcyBvZiBmcmVlZG9tLiBXaGF0IGlzIHRoZSBwcm9iYWJpbGl0eSBvZiBvYnRhaW5pbmcgdGhlIHZhbHVlIG9mICR0JCBvZiBgNDQ3LjU4YCBmcm9tIGEgdC1kaXN0cmlidXRpb24gd2l0aCA5LDk5OSBkZWdyZWVzIG9mIGZyZWVkb20/DQoNCiMjIyMgMi4xIFRoZSBwcm9iYWJpbGl0eSBvZiBvYnRhaW5pbmcgc29tZSB0LXRlc3Qgc3RhdGlzdGljIGZyb20gYSB0LWRpc3RyaWJ1dGlvbg0KDQpUaGlzIG1pZ2h0IGNvbmZ1c2UgeW91Og0KDQpgYGB7ciBlY2hvID0gVH0NCnB0KGFicyh0U3RhdGlzdGljKSwgZGYsIGxvd2VyLnRhaWwgPSBGQUxTRSkgKiAyDQpgYGANCkJ1dCBpdCBpcyByZWFsbHkgZWFzeTogYHB0KClgIGlzIHRoZSBjdW11bGF0aXZlIHByb2JhYmlsaXR5IGZ1bmN0aW9uIGZvciB0aGUgdC1kaXN0cmlidXRpb24gaW4gUiAocmVtZW1iZXIgdGhlIGBkcHFyYCBub3RhdGlvbnM6IGBkdCgpYCBpcyBpdHMgcHJvYmFiaWxpdHkgZGVuc2l0eSBmdW5jdGlvbiwgYHB0KClgIHRoZSBjdW11bGF0aXZlIGRpc3RyaWJ1dGlvbiBmdW5jdGlvbiwgYHF0KClgIGl0cyBxdWFudGlsZSBmdW5jdGlvbiwgYW5kIGBydCgpYCBpdHMgcmFuZG9tIG51bWJlciBnZW5lcmF0b3IsIHNpbWlsYXIgdG8gYGRub3JtKClgLCBgcG5vcm0oKWAsIGBxbm9ybSgpYCwgYW5kIGBybm9ybSgpYCkuIEJ1dCB3aHkgZGlkIHdlIG11bHRpcGx5IHRoZSBwcm9iYWJpbGl0eSBvZiBvYnNlcnZpbmcgdGhlIHZhbHVlIG9mIHRoZSBgdFN0YXRpc3RpY2AgZnJvbSBhIHQtZGlzdHJpYnV0aW9uIHdpdGggYGRmYCBkZWdyZWVzIG9mIGZyZWVkb20gYnkgdHdvPyAqKkJlY2F1c2Ugd2UgZG8gbm90IGNhcmUgaWYgdGhlIHNhbXBsZSBtZWFuIHRoYXQgd2UgYXJlIHRlc3RpbmcgYWdhaW5zdCB6ZXJvIGlzIGxvd2VyIHRoYW4gemVybyBvciBoaWdoZXIgdGhhbiB6ZXJvKiogLSBzbyB3ZSBoYXZlIHRvIGNvbnNpZGVyIHRoZSBwb3NzaWJpbGl0eSBvZiBvYnRhaW5pbmcgYSBwb3NpdGl2ZSBhcyB3ZWxsIGEgYXMgYSBuZWdhdGl2ZSB2YWx1ZSBvZiB0aGUgdC10ZXN0IHN0YXRpc3RpYyENCg0KT2YgY291cnNlLCBSIGhhcyBhIGhhbmR5IGB0LnRlc3QoKWAgZnVuY3Rpb24gdG8gcGVyZm9ybSB0LXRlc3RzLi4uDQoNCmBgYHtyIGVjaG8gPSBUfQ0KdC50ZXN0KG5vcm1hbFNhbXBsZSwgbXUgPSByZWFsX21lYW4sIGFsdGVybmF0aXZlID0gInR3by5zaWRlZCIpDQpgYGANCioqSGludCoqLiBUaGluazogYGFsdGVybmF0aXZlID0gInR3by5zaWRlZCJgIGluIHRoZSBgdC50ZXN0KClgIGNhbGwgYWJvdmUuIFBsZWFzZTogc3R1ZHkgdGhlIFtkb2N1bWVudGF0aW9uXShodHRwczovL3d3dy5yZG9jdW1lbnRhdGlvbi5vcmcvcGFja2FnZXMvc3RhdHMvdmVyc2lvbnMvMy42LjIvdG9waWNzL3QudGVzdCksIHJlYWQgc29tZXRoaW5nIGFib3V0IHRoZSB0LXRlc3QsIGFuZCBmaWd1cmUgb3V0IGZvciB5b3Vyc2VsZiAtIGl0IGlzIGVhc3kgLSB3aHkgY2FuIHdlIGhhdmUgKGFuZCB3aGF0IHNlbnNlIGRvZXMgaXQgbWFrZSB0byBoYXZlKSBib3RoIGBhbHRlcm5hdGl2ZSA9ICJ0d28uc2lkZWQiYCwgYGFsdGVybmF0aXZlID0gImxlc3MiYCBhbmQgYGFsdGVybmF0aXZlID0gImdyZWF0ZXIiYCENCg0KVG8gdGVzdCBhbnkgc2FtcGxlIG1lYW4gYWdhaW5zdCBhbnkgaHlwb3RoZXNpemVkIHBvcHVsYXRpb24gdmFsdWUgLSBqdXN0IGNoYW5nZSB0aGUgYHJlYWxfbWVhbmAgdmFsdWUgaW4gdGhlIGNvZGUgYWJvdmUuIEl0IGRvZXMgbm90IGhhdmUgdG8gemVybywgb2YgY291cnNlOg0KDQpgYGB7ciBlY2hvID0gVH0NCnQudGVzdChub3JtYWxTYW1wbGUsIG11ID0gOS45OCwgYWx0ZXJuYXRpdmUgPSAidHdvLnNpZGVkIikNCmBgYA0KDQpPciwgYnkgaGFuZDoNCg0KYGBge3IgZWNobyA9IFR9DQojIC0gcG9wdWxhdGlvbiAodGVzdCkgbWVhbg0KcmVhbF9tZWFuIDwtIDkuOTgNCiMgLSBzYW1wbGUgc2l6ZQ0KbiA9IDEwMDAwDQojIC0gbm9ybWFsIHBhcmFtZXRlcnMNCiMgLSBtZWFuOg0KbXUgPSAxMA0KIyAtIHZhcmlhbmNlOg0Kc2lnbWEyID0gNQ0KIyAtIHN0YW5kYXJkIGRldmlhdGlvbjoNCnN0ZF9kZXYgPSBzcXJ0KHNpZ21hMikNCiMgLSBvbmUgcmFuZG9tIGRyYXcgZnJvbSBOb3JtYWwobXUsIHN0ZF9kZXYpLCBzYW1wbGUgc2l6ZSA9IG4sIA0KIyAtIGFuZCB0YWtlIHRoZSBtZWFuDQpub3JtYWxTYW1wbGUgPC0gcm5vcm0obiwgbXUsIHN0ZF9kZXYpDQojIC0gdGVzdCBzdGF0aXN0aWM6DQp0U3RhdGlzdGljIDwtIChzYW1wbGVfbWVhbiAtIHJlYWxfbWVhbikvKHNhbXBsZV9zdGRfZGV2L3NxcnQobikpDQpwcmludChwYXN0ZTAoIlRoZSB0LXN0YXRpc3RpYyBpczogIiwgdFN0YXRpc3RpYykpDQojIC0gZGVncmVlcyBvZiBmcmVlZG9tOg0KZGYgPC0gbiAtIDENCnByaW50KHBhc3RlMCgiVGhlIG51bWJlciBvZiBkZWdyZWVzIG9mIGZyZWVkb20gaXM6ICIsIGRmKSkNCiMgLSBwLXZhbHVlDQpwdmFsdWUgPC0gcHQoYWJzKHRTdGF0aXN0aWMpLCBkZiwgbG93ZXIudGFpbCA9IEZBTFNFKSAqIDINCnByaW50KHBhc3RlMCgiVGhlIHAtdmFsdWUgaXM6ICIsIHB2YWx1ZSkpDQpgYGANCg0KUmVtZW1iZXI6IGBwLXZhbHVlIDwgLjA1YCBpcyB0aGUgY29udmVudGlvbmFsIHZhbHVlIC0gd2VsbCwgb25lIG9mIHRoZSB0d28gY29udmVudGlvbmFsIHZhbHVlcywgdGhlIG90aGVyIGJlaW5nIGAuMDFgIC0gYmV5b25kIHdoaWNoIHdlIGNhbGwgdGhlIHJlc3VsdCBvZiBzdGF0aXN0aWNhbCBoeXBvdGhlc2lzIHRlc3RpbmcgKipzaWduaWZpY2FudCoqLiBMZXQncyBkaXNjdXNzIHRoZSBpbnRlcnByZXRhdGlvbiBvZiB0aGlzIHByb2JhYmlsaXR5IGluIGV4YWN0IHRlcm1zLg0KDQojIyMjIDIuMiBTdGF0aXN0aWNhbCBIeXBvdGhlc2lzIFRlc3Rpbmc6IHRoZSBudWxsIGFuZCB0aGUgYWx0ZXJuYXRpdmUgaHlwb3RoZXNpcw0KDQpGaXJzdCwgbGV0J3MgdGFrZSBhIGxvb2sgYXQgdGhlIHQtdGVzdCBzdGF0aXN0aWMgb25jZSBhZ2FpbjoNCg0KJCR0ID0gXGZyYWN7XG92ZXJsaW5le1h9IC0gXG11fXt7U30ve1xzcXJ0e259fX0kJA0KDQpXaGF0IHdlIGNhbiBzYXkgYWJvdXQgaXQgdGhhdCBpdCByZWFsbHkgcmVwcmVzZW50cyB0aGUgZGlmZmVyZW5jZSBiZXR3ZWVuIHRoZSBzYW1wbGUgbWVhbiAkXG92ZXJsaW5le1h9JCBhbmQgdGhlIGh5cG90aGVzaXplZCBwb3B1bGF0aW9uIG1lYW4gJFxtdSQsIHNjYWxlZCBieSAke1N9L3tcc3FydHtufX0kLiBUaGUgc2NhbGluZyBpcyBwcmVzZW50IG9ubHkgdG8gbWFrZSB0aGUgZGlmZmVyZW5jZSBmb2xsb3cgdGhlIHQtZGlzdHJpYnV0aW9uLiBOb3csIGxldCdzIHRha2UgYSBsb29rIGF0IHRoZSB0LWRpc3RyaWJ1dGlvbiBhZ2FpbjoNCg0KYGBge3IgZWNobyA9IFR9DQojIC0gVGhlIFN0dWRlbnQncyB0LWRpc3RyaWJ1dGlvbjoNCmdncGxvdCh0ZGlzdCwgDQogICAgICAgYWVzKHggPSB0KSkgKyANCiAgZ2VvbV9oaXN0b2dyYW0oYmlud2lkdGggPSAuMDAxLCANCiAgICAgICAgICAgICAgICAgZmlsbCA9ICdkYXJrb3JhbmdlJywgDQogICAgICAgICAgICAgICAgIGNvbG9yID0gJ2RhcmtvcmFuZ2UnKSArDQogIGdndGl0bGUoIlRoZSBTdHVkZW50J3MgdC1kaXN0cmlidXRpb24iKSArIA0KICB0aGVtZV9idygpICsgDQogIHRoZW1lKHBhbmVsLmJvcmRlciA9IGVsZW1lbnRfYmxhbmsoKSkgKyANCiAgdGhlbWUocGxvdC50aXRsZSA9IGVsZW1lbnRfdGV4dChoanVzdCA9IC41KSkNCmBgYA0KYW5kIG5vdGUgdGhhdCBpdHMgbWVhbiBpcyAqKnplcm8qKiAoeWVzLCB5b3UgYXJlIGxvb2tpbmcgYXQgdGhlIHJlc3VsdCBvZiBhIG51bWVyaWNhbCBzaW11bGF0aW9uLCBidXQgdHJ1c3QgbWU6IFtpdCBpcyB6ZXJvXShodHRwczovL2VuLndpa2lwZWRpYS5vcmcvd2lraS9TdHVkZW50JTI3c190LWRpc3RyaWJ1dGlvbikpLiBTbyB0aGUgcHJvYmFiaWxpdHkgZGVuc2l0eSBhcm91bmQgemVybyBpcyB2ZXJ5IGhpZ2guIExldCdzIGFzc3VtZSBub3cgdGhhdCB3ZSBleHBlY3QgdG8gc2VlIG5vIGRpZmZlcmVuY2UgYmV0d2VlbiB0aGUgc2FtcGxlIG1lYW4gYW5kIHRoZSBwb3B1bGF0aW9uIG1lYW46IHdlIGV4cGVjdCB0byBvYnNlcnZlIGEgdC10ZXN0IHN0YXRpc3RpYyBvZiB6ZXJvIG9yIGNsb3NlIHRvIHplcm8uIFdlIGNhbGwgdGhpcyBhc3N1bXB0aW9uIHRoZSAqKm51bGwgaHlwb3RoZXNpcyoqIGluIHN0YXRpc3RpY2FsIGh5cG90aGVzaXMgdGVzdGluZywgYW5kIG5vdGUgaG93IHRoZSB0LWRpc3RyaWJ1dGlvbiwgY2VudGVyZWQgYXJvdW5kIHplcm8sIG5pY2VseSByZXByZXNlbnRzIHRoZSBiZWxpZWYgdGhhdCB0aGVyZSBpcyBubyBkaWZmZXJlbmNlIGJldHdlZW4gdGhlIHNhbXBsZSBtZWFuIGFuZCB0aGUgcG9wdWxhdGlvbiBtZWFuIQ0KDQpOb3csIHRoZSByZWplY3Rpb24gb2YgdGhlIG51bGwgaHlwb3RoZXNpcyBpcyBjYWxsZWQgYW4gKiphbHRlcm5hdGl2ZSBoeXBvdGhlc2lzKiosIHdoaWNoIGlzIHZlcnkgc2ltcGxlIGluIHRoZSB0LXRlc3Q6IGl0IHN0YXRlcyB0aGF0IHNhbXBsZSBtZWFuIGlzIHJlYWxseSBkaWZmZXJlbnQgZnJvbSB0aGUgcG9wdWxhdGlvbiBtZWFuLiBPaywgaG93IGRvIHdlIGtub3cgd2hlbiB0byByZWplY3QgdGhlIG51bGwgaHlwb3RoZXNpcyBhbmQgd2hlbiBub3Q/IFNpbXBseSBwdXQsIGJ5IGRvaW5nOg0KDQpgYGB7ciBlY2hvID0gVCwgZXZhbD0gRn0NCnB0KGFicyh0U3RhdGlzdGljKSwgZGYsIGxvd2VyLnRhaWwgPSBGQUxTRSkgKiAyDQpgYGANCg0Kd2hpY2ggd2lsbCB0ZWxsIHVzICp3aGF0IGlzIHRoZSBwcm9iYWJpbGl0eSB0aGF0IGEgZ2l2ZW4gdmFsdWUgb2YgdGhlIHQtdGVzdCBzdGF0aXN0aWMgaXMgb2J0YWluZWQgZnJvbSBhIGRpc3RyaWJ1dGlvbiB0aGF0IHJlcHJlc2VudHMgb3VyIG51bGwgaHlwb3RoZXNpcyouIFNvLCBpZiB0aGlzIHByb2JhYmlsaXR5IC0gdGhlIGBwLXZhbHVlYCBpbiB0aGUgb3V0cHV0IG9mIGB0LnRlc3QoKWAgLSBpcyAqKmxvdyoqLCB3ZSB1bmRlcnN0YW5kIHRoYXQgaXQgaXMgdW5saWtlbHkgdGhhdCB3ZSBoYXZlIG9ic2VydmVkIHRoZSB2YWx1ZSBvZiB0aGUgdC10ZXN0IHRoYXQgd2UgaGF2ZSBjb21wdXRlZCBmcm9tIG91ciBzYW1wbGUgaWYgdGhlIHNhbXBsZSBtZWFuIHdhcyBvYnRhaW5lZCBmcm9tIGEgcG9wdWxhdGlvbiB3aXRoIGEgaHlwb3RoZXNpemVkICh0ZXN0KSBtZWFuLiBBbmQgdGhlbiwgKipieSBjb252ZW50aW9uKiosIHdlIHNheTogaWYgdGhhdCBwcm9iYWJpbGl0eSBpcyBsb3dlciB0aGFuIGAuMDVgLCB0aGUgZmluZGluZyBpcyBjYWxsZWQgKnN0YXRpc3RpY2FsbHkgc2lnbmlmaWNhbnQqLg0KDQpUaGUgYHAtdmFsdWVgIGlzIGEgcHJvYmFiaWxpdHkgb2YgY29tbWl0dGluZyB0byBhICoqVHlwZSBJIEVycm9yIChhLmsuYS4gImEgZmFsc2UgcG9zaXRpdmUiKSoqIGluIHN0YXRpc3RpY3M6ICp0byByZWplY3QgYSBudWxsIGh5cG90aGVzaXMgd2hlbiBhIG51bGwgaHlwb3RoZXNpcyBpcyBpbmRlZWQgdHJ1ZSouIElmIHlvdSBkbyB0aGlzIHRoYXQgd291bGQgYmUgdGhlIHNhbWUgYXMgdG8gY2xhaW0gdGhhdCBzb21lIHJlc3VsdCBpcyBzaWduaWZpY2FudCB3aGlsZSBpbiBmYWN0IGl0IG9jY3VycmVkIGJ5IGNoYW5jZS4NCg0KIyMjIyAyLjMgQnVpbGRpbmcgYW4gaW50dWl0aW9uIG9uIHRoZSB2YWx1ZSBvZiBhIHQtdGVzdCwgdGhlIHJlc3BlY3RpdmUgcC12YWx1ZSwgYW5kIHRoZSBzYW1wbGUgc2l6ZQ0KDQpSZW1lbWJlciB0aGF0IHdlIGhhdmUgdXNlZCB0aGUgcG9wdWxhdGlvbiBtZWFuIG9mIGByZWFsX21lYW4gPT0gMGAgYW5kIHRoZW4gZHJhd24gYSBzYW1wbGUgZnJvbSBhIE5vcm1hbCB3aXRoIGEgbWVhbiBvZiBgbXUgPT0gMTBgIGFuZCB2YXJpYW5jZSBvZiBgc2lnbWEyID0gNWAgdG8gZXhlbXBsaWZ5IHRoZSB0LXRlc3Q/IExldCdzIHNlZSB3aGF0IGhhcHBlbnMgaWYgd2UgdmFyeSB0aGUgc2FtcGxlIG1lYW4gYXMgYGMoMTAsIDUsIDEsIC41LCAuMSwgLjAxLCAuMDAxLCAuMDAwMSlgOg0KDQpgYGB7ciBlY2hvID0gVH0NCm9wdGlvbnMoc2NpcGVuID0gOTk5KQ0KIyAtIHBvcHVsYXRpb24gKHRlc3QpIG1lYW4NCnJlYWxfbWVhbiA8LSAwDQojIC0gc2FtcGxlIHNpemUNCm4gPSAxMDAwMA0KIyAtIG5vcm1hbCBwYXJhbWV0ZXJzDQojIC0gbWVhbjoNCm11ID0gYygxMCwgNSwgMSwgLjUsIC4xLCAuMDEsIC4wMDEsIC4wMDAxKQ0KIyAtIHZhcmlhbmNlOg0Kc2lnbWEyID0gNQ0KIyAtIHN0YW5kYXJkIGRldmlhdGlvbjoNCnN0ZF9kZXYgPSBzcXJ0KHNpZ21hMikNCiMgLSByYW5kb20gZHJhd3MgZnJvbSBOb3JtYWwobXUsIHN0ZF9kZXYpLCBzYW1wbGUgc2l6ZSA9IG4sIA0KIyAtIGFuZCB0aGVuIHRha2UgdGhlIG1lYW4NCnRfdGVzdHMgPC0gbGFwcGx5KG11LCBmdW5jdGlvbih4KSB7DQogIHRlc3Rfc2FtcGxlIDwtIHJub3JtKG4sIHgsIHN0ZF9kZXYpDQogIHRlc3RfcmVzdWx0IDwtIHQudGVzdCh0ZXN0X3NhbXBsZSwgbXUgPSByZWFsX21lYW4sIGFsdGVybmF0aXZlID0gInR3by5zaWRlZCIpDQogIHJldHVybigNCiAgICBkYXRhLmZyYW1lKHNhbXBsZV9tZWFuID0geCwNCiAgICAgICAgICAgICAgIHBvcHVsYXRpb25fbWVhbiA9IHJlYWxfbWVhbiwNCiAgICAgICAgICAgICAgIHQgPSByb3VuZCh0ZXN0X3Jlc3VsdCRzdGF0aXN0aWMsIDMpLA0KICAgICAgICAgICAgICAgcCA9IHJvdW5kKHRlc3RfcmVzdWx0JHAudmFsdWUsIDMpDQogICAgICAgICAgICAgICApDQogICkNCn0pDQp0X3Rlc3RzIDwtIHJiaW5kbGlzdCh0X3Rlc3RzKQ0KcHJpbnQodF90ZXN0cykNCmBgYA0KDQpTbywgd2hlbiB0aGUgc2FtcGxlIG1lYW4gd2FzIHRha2VuIHRvIGJlIGAuMDFgIGFuZCBsb3dlciwgdGhlIHQtdGVzdCB3YXMgbm90IGFibGUgdG8gZGlmZmVyZW50aWF0ZSBpdCBmcm9tIHplcm8gYW55bW9yZSAtIGdpdmVuIHRoZSBzYW1wbGUgc2l6ZSBvZiBgbiA9IDEwMDAwYCB0aGF0IHdlIHVzZWQuIFBsZWFzZSBvYnNlcnZlIGhvdyB0aGUgdmFsdWUgb2YgdGhlIHQtdGVzdCBzdGF0aXN0aWMgZGVjcmVhc2VkIHdpdGggYSBkZWNyZWFzZSBpbiB0aGUgZGlmZmVyZW5jZSBiZXR3ZWVuIHRoZSBzYW1wbGUgYW5kIHRoZSBwb3B1bGF0aW9uIG1lYW4sIGFuZCBob3cgYXQgdGhlIHNhbWUgdGltZSB0aGUgcHJvYmFiaWxpdHkgb2Ygb2J0YWluaW5nIGEgcGFydGljdWxhciB2YWx1ZSBvZiB0aGUgdC10ZXN0IGZyb20gYSB0LWRpc3RyaWJ1dGlvbiB0aGF0IHJlcHJlc2VudHMgdGhlIG51bGwgaHlwb3RoZXNpcyBpbmNyZWFzZWQuIFdoYXQgaGFwcGVucyBpZiB3ZSBzZXQgdGhlIHNhbXBsZSBzaXplLCBgbmAsIHRvIG9uZSBtaWxsaW9uPw0KDQpgYGB7ciBlY2hvID0gVH0NCm9wdGlvbnMoc2NpcGVuID0gOTk5KQ0KIyAtIHBvcHVsYXRpb24gKHRlc3QpIG1lYW4NCnJlYWxfbWVhbiA8LSAwDQojIC0gc2FtcGxlIHNpemUNCm4gPSAxZTA2DQojIC0gbm9ybWFsIHBhcmFtZXRlcnMNCiMgLSBtZWFuOg0KbXUgPSBjKDEwLCA1LCAxLCAuNSwgLjEsIC4wMSwgLjAwMSwgLjAwMDEpDQojIC0gdmFyaWFuY2U6DQpzaWdtYTIgPSA1DQojIC0gc3RhbmRhcmQgZGV2aWF0aW9uOg0Kc3RkX2RldiA9IHNxcnQoc2lnbWEyKQ0KIyAtIHJhbmRvbSBkcmF3cyBmcm9tIE5vcm1hbChtdSwgc3RkX2RldiksIHNhbXBsZSBzaXplID0gbiwgDQojIC0gYW5kIHRoZW4gdGFrZSB0aGUgbWVhbg0KdF90ZXN0cyA8LSBsYXBwbHkobXUsIGZ1bmN0aW9uKHgpIHsNCiAgdGVzdF9zYW1wbGUgPC0gcm5vcm0obiwgeCwgc3RkX2RldikNCiAgdGVzdF9yZXN1bHQgPC0gdC50ZXN0KHRlc3Rfc2FtcGxlLCBtdSA9IHJlYWxfbWVhbiwgYWx0ZXJuYXRpdmUgPSAidHdvLnNpZGVkIikNCiAgcmV0dXJuKA0KICAgIGRhdGEuZnJhbWUoc2FtcGxlX21lYW4gPSB4LA0KICAgICAgICAgICAgICAgcG9wdWxhdGlvbl9tZWFuID0gcmVhbF9tZWFuLA0KICAgICAgICAgICAgICAgdCA9IHJvdW5kKHRlc3RfcmVzdWx0JHN0YXRpc3RpYywgMyksDQogICAgICAgICAgICAgICBwID0gcm91bmQodGVzdF9yZXN1bHQkcC52YWx1ZSwgMykNCiAgICAgICAgICAgICAgICkNCiAgKQ0KfSkNCnRfdGVzdHMgPC0gcmJpbmRsaXN0KHRfdGVzdHMpDQpwcmludCh0X3Rlc3RzKQ0KYGBgDQoNCk5vdyB3ZSBuZWVkZWQgdG8gcmVhY2ggdGhlIHZhbHVlIG9mIHRoZSBgc2FtcGxlX21lYW4gPT0gMC4wMDFgIGZvciB0aGUgdC10ZXN0IHRvIGJlIHVuYWJsZSB0byB0ZWxsIHRoYXQgaXQgaXMgc3RhdGlzdGljYWxseSBzaWduaWZpY2FudGx5IGRpZmZlcmVudCBmcm9tIHplcm8uIERvIG5vdCBmb3JnZXQgYWJvdXQgdGhpcyBleGVyY2lzZSBldmVyLg0KDQoNCiMjIyBGdXJ0aGVyIFJlYWRpbmdzDQoNCi0gW1RoZSBTdHVkZW50J3MgdC1kaXN0cmlidXRpb24gcHJvYmFiaWxpdHkgZnVuY3Rpb25zIGluIFIiXShodHRwczovL3N0YXQuZXRoei5jaC9SLW1hbnVhbC9SLWRldmVsL2xpYnJhcnkvc3RhdHMvaHRtbC9URGlzdC5odG1sKQ0KLSBbVGhlIHQudGVzdCgpIGRvY3VtZW50YXRpb24iXShodHRwczovL3d3dy5yZG9jdW1lbnRhdGlvbi5vcmcvcGFja2FnZXMvc3RhdHMvdmVyc2lvbnMvMy42LjIvdG9waWNzL3QudGVzdCkNCi0gW09uZS1TYW1wbGUgVC10ZXN0IGluIFIgZnJvbSBTVEhEQV0oaHR0cDovL3d3dy5zdGhkYS5jb20vZW5nbGlzaC93aWtpL29uZS1zYW1wbGUtdC10ZXN0LWluLXIpDQoNCg0KIyMjIFIgTWFya2Rvd24NCg0KW1IgTWFya2Rvd25dKGh0dHBzOi8vcm1hcmtkb3duLnJzdHVkaW8uY29tLykgaXMgd2hhdCBJIGhhdmUgdXNlZCB0byBwcm9kdWNlIHRoaXMgYmVhdXRpZnVsIE5vdGVib29rLiBXZSB3aWxsIGxlYXJuIG1vcmUgYWJvdXQgaXQgbmVhciB0aGUgZW5kIG9mIHRoZSBjb3Vyc2UsIGJ1dCBpZiB5b3UgYWxyZWFkeSBmZWVsIHJlYWR5IHRvIGRpdmUgZGVlcCwgaGVyZSdzIGEgYm9vazogW1IgTWFya2Rvd246IFRoZSBEZWZpbml0aXZlIEd1aWRlLCBZaWh1aSBYaWUsIEouIEouIEFsbGFpcmUsIEdhcnJldHQgR3JvbGVtdW5kcy5dKGh0dHBzOi8vYm9va2Rvd24ub3JnL3lpaHVpL3JtYXJrZG93bi8pIA0KDQoNCioqKg0KR29yYW4gUy4gTWlsb3Zhbm92acSHDQoNCkRhdGFLb2xla3RpdiwgMjAyMC8yMQ0KDQpjb250YWN0OiBnb3Jhbi5taWxvdmFub3ZpY0BkYXRha29sZWt0aXYuY29tDQoNCiFbXSguLi9faW1nL0RLX0xvZ29fMTAwLnBuZykNCg0KKioqDQpMaWNlbnNlOiBbR1BMdjNdKGh0dHA6Ly93d3cuZ251Lm9yZy9saWNlbnNlcy9ncGwtMy4wLnR4dCkNClRoaXMgTm90ZWJvb2sgaXMgZnJlZSBzb2Z0d2FyZTogeW91IGNhbiByZWRpc3RyaWJ1dGUgaXQgYW5kL29yIG1vZGlmeSBpdCB1bmRlciB0aGUgdGVybXMgb2YgdGhlIEdOVSBHZW5lcmFsIFB1YmxpYyBMaWNlbnNlIGFzIHB1Ymxpc2hlZCBieSB0aGUgRnJlZSBTb2Z0d2FyZSBGb3VuZGF0aW9uLCBlaXRoZXIgdmVyc2lvbiAzIG9mIHRoZSBMaWNlbnNlLCBvciAoYXQgeW91ciBvcHRpb24pIGFueSBsYXRlciB2ZXJzaW9uLg0KVGhpcyBOb3RlYm9vayBpcyBkaXN0cmlidXRlZCBpbiB0aGUgaG9wZSB0aGF0IGl0IHdpbGwgYmUgdXNlZnVsLCBidXQgV0lUSE9VVCBBTlkgV0FSUkFOVFk7IHdpdGhvdXQgZXZlbiB0aGUgaW1wbGllZCB3YXJyYW50eSBvZiBNRVJDSEFOVEFCSUxJVFkgb3IgRklUTkVTUyBGT1IgQSBQQVJUSUNVTEFSIFBVUlBPU0UuICBTZWUgdGhlIEdOVSBHZW5lcmFsIFB1YmxpYyBMaWNlbnNlIGZvciBtb3JlIGRldGFpbHMuDQpZb3Ugc2hvdWxkIGhhdmUgcmVjZWl2ZWQgYSBjb3B5IG9mIHRoZSBHTlUgR2VuZXJhbCBQdWJsaWMgTGljZW5zZSBhbG9uZyB3aXRoIHRoaXMgTm90ZWJvb2suIElmIG5vdCwgc2VlIDxodHRwOi8vd3d3LmdudS5vcmcvbGljZW5zZXMvPi4NCg0KKioqDQoNCg==

Intro to Data Science (Non-Technical Background, R) - Lab02

Goran S. Milovanović, PhD

Intro to Data Science (Non-Technical Background, R) - Lab02

Goran S. Milovanović, PhD

Lab 02: Statistical Hypothesis Testing: The Student’s t-distribution and the related test

What do we want to do today?

0. Setup

1. The Student’s t-distribution

2. The t-test

2.1 The probability of obtaining some t-test statistic from a t-distribution

2.2 Statistical Hypothesis Testing: the null and the alternative hypothesis

2.3 Building an intuition on the value of a t-test, the respective p-value, and the sample size

Further Readings

R Markdown