Tuesday 30 January 2018

Movendo a mineração média de dados


Suavização de dados remove a variação aleatória e mostra tendências e componentes cíclicos. Inércia na coleta de dados obtidos ao longo do tempo é alguma forma de variação aleatória. Existem métodos para reduzir o cancelamento do efeito devido a variação aleatória. Uma técnica freqüentemente usada na indústria é o alisamento. Esta técnica, quando corretamente aplicada, revela mais claramente a tendência subjacente, os componentes sazonais e cíclicos. Existem dois grupos distintos de métodos de suavização Métodos de média Métodos de suavização exponencial Tomar médias é a maneira mais simples de suavizar os dados Em primeiro lugar, investigaremos alguns métodos de média, como a média simples de todos os dados passados. Um gerente de um armazém quer saber o quanto um fornecedor típico entrega em unidades de 1000 dólares. Heshe toma uma amostra de 12 fornecedores, aleatoriamente, obtendo os seguintes resultados: A média calculada ou a média dos dados 10. O gerente decide usar isso como a estimativa de despesas de um fornecedor típico. Isto é uma estimativa boa ou ruim O erro quadrático médio é uma maneira de julgar o quão bom é um modelo. Calculamos o erro quadrático médio. O erro montante verdadeiro gasto menos o valor estimado. O erro ao quadrado é o erro acima, ao quadrado. O SSE é a soma dos erros quadrados. O MSE é a média dos erros quadrados. Resultados MSE, por exemplo, os resultados são: Erros de Erro e Esquadrão A estimativa 10 A questão surge: podemos usar a média para prever a renda se suspeitarmos de uma tendência. Um olhar no gráfico abaixo mostra claramente que não devemos fazer isso. A média pesa todas as observações passadas igualmente. Em resumo, afirmamos que a média ou média simples de todas as observações passadas é apenas uma estimativa útil para a previsão quando não há tendências. Se houver tendências, use diferentes estimativas que levem em consideração a tendência. A média pesa igualmente todas as observações passadas. Por exemplo, a média dos valores 3, 4, 5 é 4. Sabemos, é claro, que uma média é calculada adicionando todos os valores e dividindo a soma pelo número de valores. Outra maneira de calcular a média é adicionando cada valor dividido pelo número de valores, ou 33 43 53 1 1.3333 1.6667 4. O multiplicador 13 é chamado de peso. Em geral: barra frac suma esquerda (fração direita) x1 esquerda (fração direita) x2,. , Esquerda (fração direita) xn. Os (a esquerda (fração à direita)) são os pesos e, claro, somam para 1.Forecasting Serviços de Mineração e Previsão de Dados. Usando mineração de dados, empresas e organizações podem aumentar a lucratividade de seus negócios, descobrindo oportunidades e detectando riscos potenciais. Nossos serviços de consultoria de mineração de dados e análise podem ajudá-lo a extrair informações valiosas de seus dados, utilizando modelagem de previsão (análise de regressão e séries temporais). Podemos analisar seus dados e fornecê-lo com relatórios de previsão que atendam às suas necessidades. Modelos de Previsão e Previsão de Ciclo de Vida do Projeto é um componente da mineração de dados. É o processo de estimação em situações desconhecidas e é comumente usado na discussão de dados de séries temporais. Os modelos de regressão podem ser usados ​​com dados da série temporal para detectar tendências e sazonais (mesmo que os modelos também sejam úteis para dados de seção transversal). Eles podem ajudar a responder perguntas como o que serão nossas vendas no próximo trimestre e quão confiantes estamos na predição Os modelos de regressão também são muito bons para interpolação e extrapolação de dados em abordagens tanto lineares quanto não-lineares. Nossos serviços de consultoria do Excel podem fornecer relatórios de previsão testando seus dados através de vários modelos e implementando o melhor modelo determinado. Temos uma equipe de analistas de negócios, modeladores estatísticos e profissionais de TI que utilizam ferramentas como Forecast Pro, SPSS, Statistica, Access e Excel para realizar a análise. Nossos modelos de regressão incluem, mas não estão limitados a: Regressão linear e não linear Regressão múltipla Suavização exponencial com sazonalidade aditiva Suavização exponencial simples com sazonalidade multiplicativa Halt Winters suavização exponencial Halt Winters suavização exponencial simples com sazonalidade aditiva Halt Winters suavização exponencial simples com sazonalidade multiplicativa Exposição exponencial Suavização Análise de média móvel simples Análise de média móvel centralizada ARIMA (Média de Movimento Integrada Autoregressiva) Aqui estão dois exemplos de gráfico de previsão: Fig. 1. Terceiro (3º) Modelo de polinômio de ordem Regressão Linear A regressão linear é usada para modelar o valor de uma variável de escala dependente baseada Na sua relação linear com um ou mais preditores. Ele estima os coeficientes da equação linear, envolvendo uma ou mais variáveis ​​independentes que melhor predizem o valor da variável dependente. Por exemplo, você pode tentar prever as vendas anuais totais de um vendedor (a variável dependente) de variáveis ​​independentes, como idade, educação e anos de experiência. Um grupo da indústria automotiva acompanha as vendas para uma variedade de veículos motorizados pessoais. Com o objetivo de identificar modelos em excesso e com desempenho inferior, você deseja estabelecer uma relação entre as vendas de veículos e as características do veículo. Podemos usar regressão linear para identificar modelos que não estão se vendendo bem. É o número de jogos ganhos por uma equipe de basquete em uma temporada relacionada ao número médio de pontos que a equipe marca por jogo. Um gráfico de dispersão indica que essas variáveis ​​estão linearmente relacionadas. O número de jogos vencidos e o número médio de pontos marcados pelo adversário também estão relacionados linearmente. Essas variáveis ​​têm uma relação negativa. À medida que o número de jogos ganhos aumenta, o número médio de pontos marcados pelo oponente diminui. Com regressão linear, você pode modelar a relação dessas variáveis. Um bom modelo pode ser usado para prever o número de equipes de jogos que vencerão. A empresa Nambe Mills possui uma linha de produtos de mesa de metal que requerem um passo de polimento no processo de fabricação. Para ajudar a planejar o cronograma de produção, foram registrados os tempos de polimento para 59 produtos, juntamente com o tipo de produto e os tamanhos relativos desses produtos, medidos em termos de diâmetros. Podemos usar regressão linear para determinar se o tempo de polimento pode ser previsto pelo tamanho do produto. Regressão não-linear A regressão não-linear é um método para encontrar um modelo não-linear da relação entre a variável dependente e um conjunto de variáveis ​​independentes. Ao contrário da regressão linear tradicional, que é restrita à estimativa de modelos lineares, a regressão não linear pode estimar modelos com relações arbitrárias entre variáveis ​​independentes e dependentes. Isso é realizado usando algoritmos de estimação iterativos. Observe que este procedimento não é necessário para modelos polinomiais simples da forma Y A BX2. Ao definir W X2, obtemos um modelo linear simples, Y A BW, que pode ser estimado usando métodos tradicionais, como o procedimento de Regressão Linear. Pode-se prever a população com base no tempo. Um gráfico de dispersão mostra que parece haver uma forte relação entre população e tempo, mas o relacionamento não é linear, pelo que requer os métodos de estimação especiais do procedimento de Regressão não linear. Ao estabelecer uma equação apropriada, como um modelo de crescimento da população logística, podemos obter uma boa estimativa do modelo, permitindo-nos fazer previsões sobre a população por vezes que não foram realmente medidos. Um provedor de serviços de internet (ISP) está determinando os efeitos de um vírus em suas redes. Como parte deste esforço, eles rastrearam a porcentagem (aproximada) do tráfego de e-mail infectado em suas redes ao longo do tempo, desde o momento da descoberta até a ameaça contida. Podemos usar a Regressão Não-Linear para modelar o aumento e declínio da infecção. Análise de previsão Este procedimento produz valores de ajuste e valores residuais para uma ou mais séries temporais, usando um algoritmo que suaviza os componentes irregulares dos dados da série temporal. Uma variedade de modelos diferentes na tendência (nenhum, linear ou exponencial) e sazonalidade (nenhum, aditivo ou multiplicativo) estão disponíveis. As empresas com uso intensivo de estoque geralmente empregam técnicas estatísticas para projetar inventário futuro. O procedimento de Suavização Exponencial pode ser usado tanto para desenvolver um modelo da série de tempo de inventário quanto para produzir previsões rápidas com base nesse modelo. Exemplo de ARIMA (Box-Jenkins) Este procedimento estimula os modelos ARIMA não-sazonais e sazonais univariados (Módulo Médio Autoregressivo Integrado) (também conhecidos como modelos Box-Jenkins) com ou sem variáveis ​​de regressão fixas. O procedimento produz estimativas de máxima verossimilhança e pode processar séries temporais com observações faltantes. Você é responsável pelo controle de qualidade em uma fábrica e precisa saber se e quando flutuações aleatórias na qualidade do produto excedem os níveis aceitáveis ​​habituais. Você tentou modelar os escores de qualidade do produto com um modelo de alisamento exponencial, mas encontrado - presumivelmente devido à natureza altamente errática dos dados - que o modelo faz pouco mais do que prever a média geral e, portanto, é de pouca utilidade. Os modelos ARIMA são adequados para descrever séries temporais complexas. Depois de construir um modelo ARIMA apropriado, você pode traçar os resultados da qualidade do produto juntamente com os intervalos de confiança superior e inferior produzidos pelo modelo. Pontuações que ficam fora dos intervalos de confiança podem indicar um verdadeiro declínio na qualidade do produto. Uma empresa de catálogo, interessada em desenvolver um modelo de previsão, coletou dados sobre vendas mensais de roupas para homens, juntamente com várias séries que podem ser usadas para explicar uma parte da variação nas vendas. Os possíveis preditores incluem o número de catálogos enviados e o número de páginas no catálogo, o número de linhas telefônicas abertas para pedidos, o valor gasto na publicidade impressa e o número de representantes do serviço ao cliente. Alguns dos preditores são úteis para a previsão. Um modelo com preditores realmente melhor do que um sem Usar o procedimento ARIMA para criar modelos de previsão com e sem preditores e ver se há uma diferença significativa na capacidade preditiva. O mercado de varejo em uma área metropolitana de tamanho médio é dominado por duas cadeias de supermercados: Nortons e EdMart. A Nortons foi adquirida recentemente por uma grande cadeia nacional de compras que, em seguida, introduziu sua própria marca de produtos, a maioria dos quais vendendo substancialmente menos do que os produtos de marca oferecidos na EdMart. Durante vários anos, a EdMart manteve cerca de uma vantagem de 5 partes de mercado em relação à Nortons, principalmente devido ao seu serviço ao cliente superior. Durante os primeiros dois meses de propriedade, a nova empresa-mãe da Nortons lançou uma campanha agressiva anunciando sua própria linha de produtos. O resultado foi um aumento rápido e dramático na participação no mercado. O aumento da participação no mercado foi feito apenas à custa da participação da EdMarts, ou é algum aumento devido às perdas dos pequenos mantimentos que compõem o resto do mercado local. Exemplo de decomposição sazonal O procedimento de decomposição sazonal decompõe um Série em um componente sazonal, uma combinação combinada e componente de ciclo, e um componente de erro. O procedimento é uma implementação do Método do Censo I, também conhecido como o método de proporção-para-mover-média. Um cientista está interessado em analisar medições mensais do nível de ozônio em uma estação meteorológica particular. O objetivo é determinar se há alguma tendência nos dados. A fim de descobrir qualquer tendência real, o cientista primeiro precisa explicar a variação nas leituras devido a efeitos sazonais. O procedimento de decomposição sazonal pode ser usado para remover quaisquer variações sazonais sistemáticas. A análise de tendência é então realizada em séries sazonalmente ajustadas. Uma empresa de catálogo está interessada em modelar a tendência ascendente de vendas de sua linha de roupas masculinas em um conjunto de variáveis ​​preditoras, como o número de catálogos enviados e o número de linhas telefônicas abertas para pedidos. Para este fim, a empresa colecionou vendas mensais de vestuário masculino por um período de 10 anos. Para realizar uma análise de tendências (por exemplo, com um procedimento de autorregressão), é necessário remover quaisquer variações sazonais presentes nos dados. Isso é facilmente realizado com o procedimento de decomposição sazonal. Como usar uma média móvel para comprar ações A média móvel (MA) é uma ferramenta de análise técnica simples que suaviza os dados de preços, criando um preço médio constantemente atualizado. A média é tomada durante um período de tempo específico, como 10 dias, 20 minutos, 30 semanas, ou qualquer período de tempo que o comerciante escolhe. Existem vantagens em usar uma média móvel em sua negociação, bem como opções sobre o tipo de média móvel a ser usada. As estratégias de mudança de média também são populares e podem ser adaptadas a qualquer período de tempo, adequando tanto os investidores de longo prazo quanto os comerciantes de curto prazo. (Veja os quatro principais indicadores técnicos que os comerciantes da tendência precisam saber.) Por que usar uma média móvel Uma média móvel pode ajudar a diminuir a quantidade de ruído em um gráfico de preços. Veja a direção da média móvel para obter uma idéia básica de como o preço está se movendo. Angulados e o preço está subindo (ou foi recentemente) em geral, inclinado para baixo e o preço está se deslocando para baixo, movendo-se para o lado e o preço é provável em um intervalo. Uma média móvel também pode atuar como suporte ou resistência. Em uma tendência de alta, uma média móvel de 50 dias, de 100 dias ou 200 dias pode atuar como um nível de suporte, conforme mostrado na figura abaixo. Isso ocorre porque a média funciona como um piso (suporte), então o preço salta para fora disso. Em uma tendência de baixa, uma média móvel pode atuar como resistência como um teto, o preço atinge e então começa a cair novamente. O preço não respeitará sempre a média móvel dessa maneira. O preço pode atravessá-lo ligeiramente ou parar e reverter antes de alcançá-lo. Como orientação geral, se o preço estiver acima de uma média móvel, a tendência está subindo. Se o preço estiver abaixo de uma média móvel, a tendência está baixa. As médias móveis podem ter comprimentos diferentes embora (discutidos em breve), então pode-se indicar uma tendência de alta, enquanto outra indica uma tendência de baixa. Tipos de médias móveis Uma média móvel pode ser calculada de diferentes maneiras. Uma média móvel simples de cinco dias (SMA) simplesmente adiciona os cinco preços de fechamento diários mais recentes e divide-o por cinco para criar uma nova média a cada dia. Cada média está conectada ao próximo, criando a linha fluindo singular. Outro tipo popular de média móvel é a média móvel exponencial (EMA). O cálculo é mais complexo, mas basicamente aplica mais ponderação aos preços mais recentes. Trace um SMA de 50 dias e um EMA de 50 dias no mesmo gráfico, e você notará que a EMA reage mais rapidamente às mudanças de preços do que a SMA, devido à ponderação adicional em dados de preços recentes. O software de gráficos e as plataformas de negociação fazem os cálculos, portanto, nenhuma matemática manual é necessária para usar um MA. Um tipo de MA não é melhor do que outro. Um EMA pode funcionar melhor em um mercado de ações ou financeiro por um tempo, e outras vezes um SMA pode funcionar melhor. O prazo escolhido para uma média móvel também desempenhará um papel significativo na eficácia do mesmo (independentemente do tipo). Comprimento médio móvel Os comprimentos médios móveis comuns são 10, 20, 50, 100 e 200. Esses comprimentos podem ser aplicados em qualquer período de tempo do gráfico (um minuto, diário, semanal, etc.), dependendo do horizonte comercial dos comerciantes. O período de tempo ou o comprimento que você escolhe para uma média móvel, também chamado de período de retrocesso, pode desempenhar um papel importante na eficácia. Um MA com um curto período de tempo reagirá muito mais rápido para as mudanças de preços do que um MA com um longo período de retrocesso. Na figura abaixo, a média móvel de 20 dias acompanha de perto o preço real do que o 100 dias. Os 20 dias podem ser de benefício analítico para um comerciante de curto prazo, uma vez que segue o preço mais próximo e, portanto, produz menos atraso do que a média móvel de longo prazo. Lag é o tempo necessário para uma média móvel para sinalizar uma reversão potencial. Lembre-se, como orientação geral, quando o preço está acima de uma média móvel, a tendência é considerada. Então, quando o preço cai abaixo dessa média móvel, ele sinaliza uma reversão potencial com base nesse MA. Uma média móvel de 20 dias proporcionará muitos mais sinais de inversão do que uma média móvel de 100 dias. Uma média móvel pode ser qualquer comprimento, 15, 28, 89, etc. Ajustar a média móvel para que ele forneça sinais mais precisos em dados históricos pode ajudar a criar melhores sinais futuros. Estratégias de Negociação - Crossovers Os Crossovers são uma das principais estratégias de média móvel. O primeiro tipo é um crossover de preço. Isso foi discutido anteriormente e é quando o preço cruza acima ou abaixo de uma média móvel para sinalizar uma possível mudança na tendência. Outra estratégia é aplicar duas médias móveis a um gráfico, uma maior e mais curta. Quando o MA mais curto cruza acima, o termo MA mais longo é um sinal de compra, pois indica que a tendência está se deslocando. Isso é conhecido como uma cruz dourada. Quando o MA mais curto cruza abaixo do termo MA mais longo é um sinal de venda, pois indica que a tendência está a diminuir. Isto é conhecido como uma cruz de morte. As médias móveis são calculadas com base em dados históricos, e nada sobre o cálculo é de natureza preditiva. Portanto, os resultados que usam médias móveis podem ser aleatórios - às vezes o mercado parece respeitar os sinais de resistência e comércio da MA. E outras vezes não mostra respeito. Um dos principais problemas é que, se a ação de preços se tornar agitada, o preço pode diminuir e gerar sinais de inversão de tendências de tendências múltiplas. Quando isso ocorre, é melhor afastar-se ou utilizar outro indicador para ajudar a esclarecer a tendência. O mesmo pode ocorrer com os cruzamentos de MA, onde os MAs se enroscam por um período de tempo desencadeando vários negócios (gostando de perder). As médias móveis funcionam bastante bem em condições de tendências fortes, mas muitas vezes mal em condições agudas ou variáveis. Ajustar o período de tempo pode ajudar neste temporariamente, embora, em algum momento, esses problemas sejam susceptíveis de ocorrer, independentemente do período selecionado para o (s) MA (s). Uma média móvel simplifica os dados de preços, suavizando-o e criando uma linha fluida. Isso facilita as tendências de isolamento. As médias móveis exponenciais reagem mais rapidamente às mudanças de preços do que uma média móvel simples. Em alguns casos, isso pode ser bom, e em outros pode causar sinais falsos. As médias móveis com um período de retrocesso mais curto (20 dias, por exemplo) também responderão mais rapidamente às mudanças de preços do que uma média com um período de busca mais longo (200 dias). Os cruzamentos médios móveis são uma estratégia popular para entradas e saídas. Os MAs também podem destacar áreas de potencial suporte ou resistência. Embora isso possa parecer preditivo, as médias móveis são sempre baseadas em dados históricos e simplesmente mostram o preço médio durante um determinado período de tempo.

No comments:

Post a Comment