Kontakt:
Ten adres e-mail jest ukrywany przed spamerami, włącz obsługę JavaScript w przeglądarce, by go zobaczyć
telefon: +48 22 847 97 17
Ocena jakości, czyszczenie i przygotowanie danych do dalszych analiz

Adresaci:

  • Pracownicy Działu Marketingu, Sprzedaży, CRM;
    • Osoby chcące zdobyć wiedzę na temat pracy z danymi oraz sposobu ich przygotowania do dalszych analiz statystycznych, Data Mining, zestawień oraz raportów;
    • Analitycy, którzy chcą samodzielnie przygotowywać dane do analiz.

Zakres tematyczny szkolenia:

  • Przygotowanie danych do analizy
    • rodzaje źródeł danych oraz typy zmiennych
    • przygotowanie populacji do modelowania
      • definicja horyzontu czasowego przedmiotu modelowania
      • wykluczenia obserwacji
      • przeważanie zbiorów
      • podział populacji na zbiory treningowe i testowe
    • statystyczna eksploracja danych
      • analiza rozkładów zmiennych
      • analiza korelacji
        • podział wskaźników ze względu na typy zmiennych
    • zmienne pochodne
      • transformacje zmiennych ciągłych
        • transformacja Box’a-Cox’a
        • windsoryzacja
      • transformacje zmiennych dyskretnych
        • binaryzacja
        • grupowanie
        • waga dowodu
        • interakcje
  • Ocena jakości oraz czyszczenie danych
    • podstawowe procesy Data Quality
      • parking, householding, standaryzacja, reduplikacja, wzbogacanie danych
    • standaryzacja, reduplikacja
      • miara Levnstheina
      • miara Jaro
      • q-gramy
    • profilowanie danych
    • zastępowanie braków w danych
      • podział metod ze względu na typ zmiennej
      • metody regresyjne
      • metody Monte Carlo
    • wartości odstające
      • testy statystyczne
        • prawo 3 sigma
    • analiza zmiennych o wartościach obciętych lub wartościach cenzurowanych

Forma szkolenia:

Wykład połączony z warsztatami

 

Uwaga!

Szkolenia oferowane przez firmę StatConsulting wzbogacane są poprzez zajęcia warsztatowe, w tym również zajęcia z użyciem komputerów. Przy pracy z komputerami używane jest oprogramowanie analityczne AdvancedMiner w wersji przystosowanej do potrzeb szkolenia. Dzięki temu uczestnicy szkolenia nie muszą uczyć się obsługi programu lecz mogą całą swoją uwagę skupić na treści merytorycznej warsztatu zdobywając wiedzę i doświadczenie. Dzięki takiemu rozwiązaniu nasze szkolenia nie są związane z żadnym oprogramowaniem a zdobyta na nich wiedza jest użyteczna i pełnowartościowa niezależnie od narzędzi analitycznych używanych w codziennej pracy.


 

 

© Copyright by StatConsulting 2010 - All rights reserved