Teste T e regressão linear são termos relacionados à estatística inferencial, que é o método estatístico que nos ajuda a fazer generalizações e previsões sobre uma população, tomando uma amostra pequena, mas ilustrativa, dessa população. Três tipos de metodologias são normalmente usados em estatísticas inferenciais - intervalos de confiança, testes de hipótese e análise de regressão.
Teste T vs Regressão Linear
A diferença entre o teste T e a regressão linear é que a regressão linear é aplicada para elucidar a correlação entre uma ou duas variáveis em uma linha reta. Enquanto o T-test é uma das ferramentas de testes de hipóteses aplicadas aos coeficientes de inclinação ou coeficientes de regressão derivados de uma regressão linear simples.
Enquanto o teste T é um dos testes usados no teste de hipótese, a regressão linear é um dos tipos de análise de regressão. A regressão linear é usada para verificar a extensão da relação linear entre a variável de resultado (variável dependente) e uma ou mais variáveis preditoras (variáveis independentes).
O T-test é um dos testes de hipóteses conduzidos para descobrir se a diferença entre as médias de dois grupos é notável ou não, quer essas diferenças tenham acontecido por acaso ou não.
Tabela de comparação entre o teste T e a regressão linear (na forma tabular)
Parâmetro de Comparação | Teste t | Regressão linear |
---|---|---|
Método Estatístico | Um teste T é uma das ferramentas de teste hipotético que, por sua vez, é um método de estatística inferencial. | A regressão linear é um dos tipos de análise de regressão que também é um método de estatística inferencial. |
Uso | Um teste T é usado para comparar as médias de dois conjuntos diferentes de dados observados e para descobrir em que medida tal diferença é "por acaso". | A regressão linear é usada para encontrar a relação entre uma variável dependente ou de resultado e uma ou mais variáveis independentes ou preditoras. |
Tipos | Os testes T são principalmente de três tipos, a saber: Teste t de Amostra Independente (comparação entre a média de dois conjuntos de dados), Teste T de Amostra emparelhado (comparação das médias dos mesmos conjuntos de dados em intervalos diferentes) e Teste T de Uma Amostra teste (comparando a média de um único conjunto de dados com uma média conhecida). | Existem dois tipos de Regressão Linear, a saber, Regressão Linear Simples (compreendendo uma variável dependente e uma independente) e Regressão Linear Múltipla (consistindo em uma variável dependente e duas ou mais variáveis independentes). |
Aplicações práticas | O teste T pode ser usado para testar os retornos de duas carteiras diferentes administradas sob duas estratégias de investimento diferentes. Foi usado pela primeira vez para verificar a qualidade consistente da cerveja preta forte em uma cervejaria. | A regressão linear é usada principalmente para observar o comportamento do cliente, preços, previsão de vendas para uma empresa, clima, crescimento do PIB, etc. |
O número de variáveis ou conjuntos que podem ser usados. | Apenas dois conjuntos de dados ou grupos podem ser usados em um teste t. | Embora haja apenas um regressando, o número de regressores pode ser superior a dois. |
O que é o teste T?
Um teste T é um dos instrumentos usados em testes de hipóteses para comparar dois conjuntos diferentes de dados e suas médias ou médias. Outros são o teste de análise de variância, o teste Z, o teste qui-quadrado e o teste F.
Um teste T é usado para verificar a diferença significativa entre dois conjuntos de dados. É usado para determinar quanto dessa diferença é por acaso.
Foi usado pela primeira vez por William Sealy Gosset, um químico que trabalhava para uma cervejaria chamada Guinness para monitorar a qualidade consistente da cerveja preta.
Gradualmente, ele foi atualizado e agora se refere a quaisquer testes de hipótese em que os dados, quando analisados, deveriam ser equivalentes a uma distribuição t (uma curva de distribuição em forma de sino com caudas mais pesadas) se a hipótese nula (a suposição de que nenhum relacionamento existe entre os conjuntos de dados) prova estar certa.
Para a interpretação e validação padrão, depende de certas suposições sobre uma amostra da população.
Tais suposições são compostas por dados, isto é, amostrados aleatoriamente, variáveis de dados, que seguem uma distribuição normal, uma variância que é desconhecida e considerada homogênea e uma escala de medição que quando aplicada aos dados coletados resulta em uma linha contínua.
Existem três tipos de testes T:
Como uma abordagem para testar hipóteses, o teste T é bastante conservador. Ele pode ser aplicado a apenas dois conjuntos de dados e é considerado adequado apenas para pequenos conjuntos de dados.
O que é regressão linear?
A regressão linear é um método de estatística inferencial que tenta explicar a correlação entre uma variável dependente (Y) e uma ou mais variáveis independentes (X) usando uma linha reta. Ele lida principalmente com três tipos de perguntas:
- Um conjunto de variáveis explicativas prediz corretamente a variável de resultado?
- Em caso afirmativo, quais são as variáveis independentes ou explicativas mais proeminentes que afetam significativamente a variável dependente ou de resultado?
- E, por último, em que medida uma mudança nessas variáveis independentes ou explicativas afeta o resultado ou a variável dependente?
A relação entre a variável de resultado e as variáveis explicativas é considerada positiva se um aumento nas últimas resultar em um aumento nas primeiras.
Da mesma forma, uma relação entre a variável dependente e a independente é considerada negativa se a primeira diminui com o aumento da última.
A regressão linear tem três usos:
- Para decidir a força das variáveis independentes, ou seja, em que medida elas influenciam a variável independente.
- Para prever a mudança na variável dependente induzida pelas variáveis independentes.
- Para prever tendências e valores futuros.
Existem basicamente dois tipos de regressões lineares: Regressão Linear Simples que consiste em uma variável dependente e uma variável independente e Regressão linear múltipla que compreende uma variável dependente e duas ou mais variáveis independentes.
Principais diferenças entre o teste T e a regressão linear
Conclusão
Tanto o teste T quanto a regressão linear se enquadram na estrutura mais ampla de estatísticas inferenciais que são usadas para fazer suposições sobre uma determinada população usando uma pequena amostra. Eles desempenham papéis diferentes e são ferramentas essenciais para inferir as características gerais de uma população.
Embora a regressão linear ajude a fazer certas previsões sobre uma amostra particular, por exemplo, comportamento do cliente, o teste T ajuda a testar a aplicabilidade de uma hipótese a uma população de amostra.