Metody wielowymiarowej analizy w poszukiwaniu fizyki spoza
Transkrypt
Metody wielowymiarowej analizy w poszukiwaniu fizyki spoza
Metody wielowymiarowej analizy w poszukiwaniu fizyki spoza Modelu Standardowego Autorzy: Piotr Gładysz, Piotr Pilip, Ewa Płaszczyca Prowadzący: dr Bartłomiej Żabiński Praktyki studenckie ATLAS 2016 Plan Prezentacji 1. Wprowadzenie 2. Opracowywane dane 3. Zastosowane metody 4. Wyniki TMVA i SciKit 5. Optymalizacja metody BDT 6. Podsumowanie 2 Poszukiwanie nowej fizyki 3 Poszukiwanie nowej fizyki 4 Poszukiwanie nowej fizyki 5 Poszukiwanie nowej fizyki 6 Poszukiwanie nowej fizyki 7 Jak znaleźć nowy Bozon Higgsa? Niektóre modele spoza Modelu Standardowego przewidują produkcję ciężkiego bozonu Higgsa w stowarzyszeniu z kwarkiem b. Dane • Pochodzą z symulacji Monte Carlo. • Przypadki sygnału zostały wygenerowane dla 8 różnych mas poszukiwanego bozonu Higgsa (400, 450, 500, 550, 600, 650, 700 i 800 GeV). • Podczas analizy użyto przypadków w których w stanie końcowym znajdują się 3 jety pochodzące od kwarków b. • Próbka z tłem została wygenerowana dla całego zakresu mas bozonu Higgsa uwzględniając przypadki podobne do poszukiwanych. Rys.2 Przykładowy diagram Feynmana dla produkcji ciężkiego bozonu Higgsa 8 Dobór zmiennych Pęd poprzeczny Pseudo rapidity (Eta) Kąt Phi Energia jetu (E) 9 Dobór zmiennych Pęd poprzeczny Pseudo rapidity (Eta) Kąt Phi Energia jetu (E) 53 Zmienne 10 Dobór zmiennych Pseudo rapidity (Eta) Pęd poprzeczny Kąt Phi Energia jetu (E) 53 Zmienne Eta2 Phi23 Boost Phi1 Theta1 Boost E1 R23 11 Sygnał i tło dla poszczególnych zmiennych 12 Wielowymiarowa analiza przy użyciu pakietu TMVA i SciKit Learn Toolkit for Multi Variate Analysis Pakiet znajdujący się w standardowym pakiecie ROOT. Zawiera funkcje i algorytmy pozwalające na analizę skomplikowanych danych z pomocą maszynowego uczenia. SciKit – learn Jest to pakiet języka Python przeznaczony do pracy przy użyciu algorytmów maszynowego uczenia, charakteryzuje się prostotą w użyciu i wysoką wydajnością. 13 Sieci neuronowe Sieci neuronowe schemat działania: Pojedynczy neuron: 14 Drzewa decyzyjne Przykładowe drzewo decyzyjne dla masy 400 GeV: 15 Porównanie metod BDT i MLP (TMVA) Masa 400 GeV Masa 600 GeV Masa 800 GeV 16 Porównanie pakietu TMVA i SciKit Masa 400 GeV Masa 600 GeV Masa 800 GeV 17 Receiver Operating Characteristics Masa 400 GeV Masa 600 GeV Masa 800 GeV 18 Optymalizacja przeprowadzona w pakiecie SciKit Zmieniane parametry przy metodzie BDT: • NTrees – liczba drzew w epoce (100-1000) • MaxDepth – największa dopuszczalna głębokość drzewa decyzyjnego (2-6) • MinNodeSize – najmniejszy procent trenowanych zdarzeń potrzebnych w węźle dla danego liścia (2-5) • AdaBoostBeta – wkład każdego drzewa. (0.1-1.0) 19 Podsumowanie • Wybranie 6 zmiennych nie powoduje znaczących zmian w wynikach analizy (mniej niż 5%) . • Im większa rozważana masa neutralnego bozonu Higgsa tym bardziej efektywne jest oddzielanie sygnału od tła. • BDT jest korzystniejszą metodą ze względu na czas uczenia, dając wyniki porównywalne z sieciami neuronowymi. • Przy odrzucaniu tła na poziomie 95% zostaje co najmniej 20% przypadków sygnału. • Domyślne ustawienia parametrów metody BDT w pakiecie TMVA są wystarczające 20 Dziękujemy za uwagę! Brak przeuczenia 22 Korelacja pomiędzy zmiennymi 23 Przypadki uwzględnione w próbce tła 24