Masowy import danych - POL-on
Transkrypt
Masowy import danych - POL-on
Masowy import danych Marek Michajłowicz Agenda • Proces importu • Główne założenia • Wybrane scenariusze importu Kontekst importu i terminy Czynności przygotowawcze • Akceptacja struktury jednostki • Dodanie uprawnień w zakresie importu masowego odpowiednim pracownikom (rola INST_IMPORT) • Edycja i pobranie kluczy Jednostek (słowniki importu) • Pliki importu powinny być najpierw skompresowane do formatu .zip • Kodowanie w UTF-8 • Pliki wewnątrz paczki importu powinny być podzielone pod względem zawartości (Studenci, Pracownicy) Proces importu jest asynchroniczny • W pierwszym etapie weryfikacja zgodności ze schematem XML oraz uprawnienia • Użytkownik od razu powiadamiany o wyniku operacji • Po zakończeniu plik dodawany do kolejki importu • Import uruchamiany w godzinach wieczornych. • Po przetworzeniu wysyłany e-mail do użytkownika z informacją o wyniku importu Wycofanie importu • Import inicjalny daje możliwość całkowitego wycofania zmian w bazie wprowadzonych w ramach importu zakończonego wynikiem pozytywnym. • Jako import inicjalny kwalifikowany jest każdy import wykonany w tracie pilotażu, czyli do dnia 30-09-2011 r. • Operacja anulowania importu jest możliwa dla pliku będącego w statusie przekazany do zaimportowania • Operacja anulowania daje możliwość zweryfikowania zgodności plików ze schematem i słownikami bez konieczności całkowitego importu Główne założenia • Plik importu zaczytywany jest do systemu wyłącznie wtedy, gdy w pełnym zakresie przejdzie proces walidacji. Żaden pojedynczy rekord pliku nie może mieć błędów zdefiniowanych w systemie jako odrzucające plik • Korekta polega na zastąpieniu poprzednio wysłanych danych danymi skorygowanymi • Jako zasada rozwiązywania konfliktów obowiązuje reguła „ostatni wygrywa” • System na bazie zawartości pliku rozpoznaje określony typ operacji: dodania, aktualizacji, wyrejestrowania studenta lub pracownika z rejestru • W trakcie importu w jednostce nie można wprowadzać danych z interfejsu użytkownika Spójność danych w plikach Minimum kadrowe Zatrudnienie Pracownik Naukowy Osoba • Pliki XML zawierają obiekty określonego typu (Student, Pracownik, Doktorant), które powinny zachować wewnętrzną spójność • Nie ma możliwości przekazania wyodrębnionej sekcji zatrudnienia bez informacji o osobie. Można natomiast przekazać zatrudnienia bez oświadczenia o minimum kadrowym, jeżeli nie zostało ono złożone • Przekazywanie pełnego zakresu danych ma na celu zapewnienie spójności pomiędzy systemami i uwzględnienie wszystkich zmian zachodzących w czasie (np. tych które nie zostały przekazane w ramach wcześniejszych importów) • Komplet danych umożliwia bardziej wiarygodną identyfikację osoby z pliku Import pełny czy przyrostowy? Id kierunku Jan Kowalski Data Wyrejestr owania Wyrejestruj Studenta • Brak różnicy danych nie powoduje zmian w bazie • Z punktu widzenia algorytmów importu istotne są tylko różnice • Z uwagi na wydajność systemu sugeruje się przekazywać wyłącznie dane, które uległy zmianie od czasu ostatniego wprowadzenia Scenariusz obsługi błędów • Błędy pierwszego etapu walidacji dotyczą przede wszystkim struktury pliku, jego zgodności ze schematem oraz słownikami • Błędy wynikające z importu opierają się na weryfikacji stanu bazy oraz złożonych reguł uwzględniających zależności pomiędzy danymi w pliku • Do każdego zestawu błędów użytkownik otrzyma szczegółowe zestawienia umożliwiające identyfikację i szybką korektę pliku • W oparciu o informację o błędach należy dokonać korekty i zaczytać plik ponownie Błedy struktury pliku Błędy logiki biznesowej Słownik błędów • Zbiór reguł walidacyjnych dla danych importowanych i wprowadzanych z interfejsu • Rozszerzony o instrukcje rozwiązywania problemów • Słownik pozwala na dynamiczne stosowanie reguł. W specyficznych okolicznościach istnieje możliwość wyłączenia reguły walidacyjnej dla importu Kod błę du Typ Grupa błędów Kategoria błędu Dotyczy (K - błąd krytyczny O – ostrzeżenie) 001 K Błędy wstępnej walidacji Błąd kodowania pliku Struktury pliku 002 K Błędy wstępnej walidacji błąd uprawnień Struktury pliku Etap walidacji (GInterfejs użytkownika , I - import) I I Reguła walidacyjna Opis biznesowy (Komunikat błędu) Sugerowane działanie (Instrukcja postępowania dla pracownika Uczelni) Formatowanie pliku inne niż UTF – 8 Błędne kodowanie pliku Poprawienie pliku, zmiana deklaracji kodowania w nagłówku IdInstytucji z pliku XML <> IdInstytucji znajującej się w obszarze uprawnień ADMIN-a Kod instytucji spoza zakresu uprawnień importowych Najprawdopodob niej wprowadzono niewłaściwy klucz jednostki lub nie rozszerzono uprawnień administratora Zamiast zakończenia Rozwiązania na przyszłość: • Interfejs Web Services • weryfikacja PESEL w oparciu o system MSWiA Instrukcje importu: • http://polon.nauka.gov.pl/dokuwiki/doku.php/import • http://polon.nauka.gov.pl/instrukcje-uzytkownika