Metody wielowymiarowej analizy w poszukiwaniu fizyki spoza

Transkrypt

Metody wielowymiarowej analizy w poszukiwaniu fizyki spoza
Metody wielowymiarowej
analizy w poszukiwaniu fizyki
spoza Modelu Standardowego
Autorzy: Piotr Gładysz, Piotr Pilip, Ewa Płaszczyca
Prowadzący: dr Bartłomiej Żabiński
Praktyki studenckie ATLAS 2016
Plan Prezentacji
1. Wprowadzenie
2. Opracowywane dane
3. Zastosowane metody
4. Wyniki TMVA i SciKit
5. Optymalizacja metody BDT
6. Podsumowanie
2
Poszukiwanie nowej fizyki
3
Poszukiwanie nowej fizyki
4
Poszukiwanie nowej fizyki
5
Poszukiwanie nowej fizyki
6
Poszukiwanie nowej fizyki
7
Jak znaleźć nowy Bozon Higgsa?
Niektóre modele spoza Modelu Standardowego przewidują produkcję
ciężkiego bozonu Higgsa w stowarzyszeniu z kwarkiem b.
Dane
• Pochodzą z symulacji Monte Carlo.
• Przypadki sygnału zostały
wygenerowane dla 8 różnych mas
poszukiwanego bozonu Higgsa (400,
450, 500, 550, 600, 650, 700 i 800 GeV).
• Podczas analizy użyto przypadków w
których w stanie końcowym znajdują się
3 jety pochodzące od kwarków b.
• Próbka z tłem została wygenerowana
dla całego zakresu mas bozonu Higgsa
uwzględniając przypadki podobne do
poszukiwanych.
Rys.2 Przykładowy diagram Feynmana dla
produkcji ciężkiego bozonu Higgsa
8
Dobór zmiennych
Pęd
poprzeczny
Pseudo
rapidity
(Eta)
Kąt Phi
Energia
jetu (E)
9
Dobór zmiennych
Pęd
poprzeczny
Pseudo
rapidity
(Eta)
Kąt Phi
Energia
jetu (E)
53 Zmienne
10
Dobór zmiennych
Pseudo
rapidity
(Eta)
Pęd
poprzeczny
Kąt Phi
Energia
jetu (E)
53 Zmienne
Eta2
Phi23
Boost
Phi1
Theta1
Boost
E1
R23
11
Sygnał i tło dla poszczególnych
zmiennych
12
Wielowymiarowa analiza przy użyciu
pakietu TMVA i SciKit Learn
Toolkit for Multi Variate Analysis
Pakiet znajdujący się w
standardowym pakiecie ROOT.
Zawiera funkcje i algorytmy
pozwalające na analizę
skomplikowanych danych z
pomocą maszynowego uczenia.
SciKit – learn
Jest to pakiet języka Python
przeznaczony do pracy przy użyciu
algorytmów maszynowego uczenia,
charakteryzuje się prostotą w
użyciu i wysoką wydajnością.
13
Sieci neuronowe
Sieci neuronowe schemat działania:
Pojedynczy neuron:
14
Drzewa decyzyjne
Przykładowe drzewo decyzyjne dla masy 400 GeV:
15
Porównanie metod BDT i MLP (TMVA)
Masa 400 GeV
Masa 600 GeV
Masa 800 GeV
16
Porównanie pakietu TMVA i SciKit
Masa 400 GeV
Masa 600 GeV
Masa 800 GeV
17
Receiver Operating Characteristics
Masa 400 GeV
Masa 600 GeV
Masa 800 GeV
18
Optymalizacja przeprowadzona w
pakiecie SciKit
Zmieniane parametry przy metodzie BDT:
• NTrees – liczba drzew w epoce (100-1000)
• MaxDepth – największa dopuszczalna głębokość drzewa decyzyjnego (2-6)
• MinNodeSize – najmniejszy procent trenowanych zdarzeń potrzebnych w węźle dla danego liścia (2-5)
• AdaBoostBeta – wkład każdego drzewa. (0.1-1.0)
19
Podsumowanie
• Wybranie 6 zmiennych nie powoduje znaczących zmian w
wynikach analizy (mniej niż 5%) .
• Im większa rozważana masa neutralnego bozonu Higgsa tym
bardziej efektywne jest oddzielanie sygnału od tła.
• BDT jest korzystniejszą metodą ze względu na czas uczenia,
dając wyniki porównywalne z sieciami neuronowymi.
• Przy odrzucaniu tła na poziomie 95% zostaje co najmniej
20% przypadków sygnału.
• Domyślne ustawienia parametrów metody BDT w pakiecie
TMVA są wystarczające
20
Dziękujemy za uwagę!
Brak przeuczenia
22
Korelacja pomiędzy zmiennymi
23
Przypadki uwzględnione w próbce tła
24