Learning machine w obliczeniach elektromagnetycznych
SIMULIA z przyjemnością współpracuje z liderami inżynierii i naukowcami, którzy wykorzystują możliwości symulacji, aby pomóc kształtować przyszłość swojej branży. Dziś z dumą przedstawiamy Jana Carstena Hansena z Uniwersytetu Technicznego w Grazu i mistrza SIMULIA 2023, który omówi korzyści jakie niesie z sobą wprowadzenie Learning Machines (LM) do obliczeń symulacyjnych w obszarze elektromagnetyzmu.
Czy może nam Pan opowiedzieć nam o LM, i o korzyściach jakie może ono przynieść w zakresie obliczeń elektromagnetycznych?
Układy elektroniczne oraz ich elektromagnetyczne sprzężenia są bardzo złożone. Istnieją szereg zasad, które są zapisane w podręcznikach. Istnieje również wiele indywidualnych projektów elektronicznych, tak że niemożliwe jest przewidywanie ich wzajemnych interakcji w oparciu o podstawowe reguły. Zazwyczaj w każdej dużej firmie są doświadczeni inżynierowie EMC, którzy na podstawie wieloletniego doświadczenia mogą najlepiej ocenić ryzyko wystąpienia problemów EMC dla danego systemu, układu oraz sposób ich eliminacji. Mogą to zrobić, ponieważ są ekspertami i widzieli w swoim życiu działanie wielu układów w różnych sytuacjach i stanach operacyjnych.
W LM chodzi przede wszystkim o doświadczenie. Trenujemy dany model w oparciu o dostępne dane. Gdy model jest wystarczająco dokładny, używamy go do badania interesujących nas przypadków, dla których został wyszkolony. Główną zaletą modelu jest to, że działa on z dość dużą liczbą parametrów, które mogą się dynamicznie zmieniać, i oblicza je bardzo szybko. Ostatecznie model naśladuje to, co robi doświadczony inżynier EMC: na podstawie pewnych obserwacji wnioskujemy o podobnych przypadkach. Oczywiście mózg doświadczonego inżyniera EMC jest znacznie mądrzejszy i potrafi wywnioskować znacznie więcej niż jakikolwiek model LM. Ale model LM uczy się bardzo szybko, może uczyć się np. 24 godziny na dobę. W dzisiejszych czasach mamy do czynienia z wieloma nowinkami technologicznymi. Jestem przekonany, że model LM może pomóc inżynierowi EMC w szybkim zdobywaniu wiedzy, znacznie szybciej niż w przypadku indywidualnych badań metodą prób i błędów.
Czy możesz nakreślić główne motywacje do integracji sztucznej inteligencji z symulacją EMC w swojej pracy na Politechnice w Graz?
Mam dwie motywacje, które są w różnym stanie dojrzałości. Pierwszą z nich jest optymalizacja wieloobiektowa. W projektowaniu produktów nie ma jednego optimum, które chciałbym znaleźć. Zawsze istnieją kompromisy, czyli wymagana jakość przy danym budżecie. Dlatego im więcej pieniędzy wydam, tym wyższa będzie jakość i żywotność mojego produktu. Mając mniej pieniędzy, nie mogę projektować z taką samą jakością. Ale zawsze chcę mieć najlepszą możliwą jakość za zainwestowane pieniądze. W projektowaniu produktów istnieje wiele takich kompromisów; koszt jest jednym z nich, ograniczenia EMC, wydajność i sprawność, konstrukcja termiczna, itp. Zwykle, jeśli poprawisz jeden z nich, zepsujesz inne. W celu oceny te kompromisy, należy zbadać dla wielu próbek. Modele LM oferują doskonałą okazję do tworzenia takich próbek.
Drugim tematem jest złożoność modeli EMC. W szczególności, przy wysokich częstotliwościach; powiedzmy częstotliwościach, przy których modele elementów bryłowych nie są już wystarczająco dokładne i muszę rozwiązywać problemy elektromagnetyczne; muszę zebrać wiele parametrów, aby zbudować swój model. Parametry materiałów, wymiary, modele urządzeń, półprzewodników, informacje o oprogramowaniu sterującym sygnałami, itp. Mógłbym to zrobić, ale to wymaga czasu. To, co ludzie zwykle robią, to zgadywanie większości brakujących informacji. Tak więc w modelach 3D EM występuje duża niepewność parametrów. Znam zakresy parametrów, ale nie znam ich dokładnej wartości. Aby przekształcić niepewny model w dokładny, musimy go skalibrować. Najczęściej dostępne są pewne pomiary, przynajmniej odpowiedź badanego obiektu na pewne wzbudzenia. Lubię używać metod LM do kalibracji niepewnych parametrów przy użyciu tych pomiarów. Jest to zadanie wnioskowania statystycznego, czyli szacujemy najbardziej prawdopodobny zestaw parametrów, które dają prawidłowe, zmierzone wyniki. Ponieważ statystyka wymaga również wielu ocen modeli, model LM jest jedyną możliwością znalezienia tego zestawu parametrów.
Czym jest model zastępczy i dlaczego jest przydatny w analizie EMC?
Istnieje kilka definicji modelu zastępczego. Dla mnie model zastępczy to model behawioralny, który naśladuje fizyczną reakcję testowanego systemu. Model ten nie wykazuje żadnych fizycznych informacji o systemie, ale jest zbudowany z modeli fizycznych, a także z pomiarów lub obu tych elementów. Ponadto surogaty, o których mówię, są bardzo szybkie w ocenie, co czyni je tak potężnymi. Zasadniczo jest to nieparametryczny model regresji na wielu parametrach. Istnieje wiele metod. Bardzo często spotyka się sieci neuronowe, ponieważ są łatwe do wdrożenia, ale istnieje równie wiele innych, takich jak procesy gaussowskie, wielomianowa ekspansja chaosu, itp.
Jak wspomniano powyżej, EMC to w dużej mierze studia przypadków i zdobywanie doświadczenia. EMC jest również drugorzędną właściwością produktu. Nikt nie kupuje produktu ze względu na jego doskonałą wydajność w odniesieniu do zgodności EM. Tak więc projektowanie EMC jest konfrontowane z ideą kompromisów. Daj mi produkt, który jest tak fajny, jak to tylko możliwe pod wieloma względami, a jednocześnie spełnia wymagania EMC. Kompromisy wymagają wielu ocen modeli i dlatego potrzebuję surogatu.
Jaki jest typowy przepływ pracy dla symulacji EMC przy użyciu AI? Jak połączyć wyniki symulacji CST z modelem AI?
Na początku potrzebny jest początkowy zestaw próbek do wytrenowania modelu. Po jego wygenerowaniu potrzebne są fizyczne informacje o systemie. Należy je pozyskać z CST. Interfejs Python jest tutaj bardzo przydatny. Niestety, mniej informacji na temat tego interfejsu jest dostępnych niż powinno. Po jego opanowaniu można wielokrotnie oceniać model na zestawie danych treningowych i skompilować model zastępczy. Można to również zrobić w kilku krokach; na przykład zaczynasz od małego zestawu danych szkoleniowych, kompilujesz model i testujesz model na większej ilości dostępnych danych. Jeśli model nie jest jeszcze dokładny, generujesz więcej danych szkoleniowych, szczególnie w obszarach, w których model jest zły, i kontynuujesz szkolenie. Nazywa się to uczeniem adaptacyjnym. Jest to inteligentna strategia w przypadkach, w których model deterministyczny wymaga długiego czasu obliczeń. Mówienie o sztucznej inteligencji jest w rzeczywistości przesadą. Sztuczna inteligencja to coś, co wymaga tysięcy lub milionów danych treningowych. My po prostu pracujemy z regresją i potrzebujemy około 100 danych treningowych, ponieważ używamy ciężkich obliczeniowo modeli.
W jaki sposób zapewnić, że te generowane przez sztuczną inteligencję modele zastępcze utrzymują wysoki poziom dokładności w porównaniu z ich pełnofalowymi odpowiednikami?
To dość proste. Model pełnofalowy (lub jakikolwiek inny model fizyczny) jest zawsze dostępny. Mogę przetestować mój model zastępczy względem modelu pełnofalowego, co i tak robię podczas procedury treningowej. Ponadto, gdy obliczyłem optymalną konfigurację parametrów w jakimś zadaniu optymalizacyjnym przy użyciu surogatu, zawsze stosuję ten zestaw parametrów w oryginalnym modelu fizycznym, aby sprawdzić, czy surogat dobrze przewidział.
Jakie były najbardziej znaczące postępy technologiczne w dziedzinie sztucznej inteligencji, które umożliwiły jej zastosowanie w symulacji EMC?
Najbardziej ekscytującą cechą modeli AI i LM jest to, że przełamują one klątwę wymiarowości. W przestrzeniach wielowymiarowych punkty danych stają się rzadkie i rozproszone. Liczba punktów danych wymaganych do pełnego próbkowania danej przestrzeni projektowej rośnie wykładniczo wraz z liczbą wymiarów: aby próbkować przestrzeń 3D z 3 próbkami w każdym wymiarze (a trzy próbki to niewiele: to jak min/max/ i jedna wartość pomiędzy), potrzebuję 33=27 próbek. Jeśli jest 8-wymiarowa, to 38= 6561, a przy 15 wymiarach jest to ponad 14 milionów próbek.
Rysunek 2: Elektryczny układ napędowy jest sercem pojazdu elektrycznego i jego głównym źródłem emisji. (dzięki uprzejmości BMW Group Steyr Plant)
LM rozwiązał ten problem. Istnieją wyrafinowane strategie próbkowania, które działają dla przestrzeni projektowych o 15 lub nawet 18 wymiarach. We wszystkich przypadkach, które do tej pory zbadaliśmy, nigdy nie potrzebowaliśmy więcej niż, powiedzmy, 1000 próbek treningowych. To niesamowite. Sprawdziło się to w przypadku wielu różnych problemów EMC, czy to modeli filtrów EMI, konwerterów mocy, czy emisji promieniowanej ekranowanych przewodów.
W jakich scenariuszach wykorzystanie sztucznej inteligencji w symulacji EMC jest najbardziej korzystne?
Widzimy natychmiastową korzyść ze sztucznej inteligencji w wielozadaniowej optymalizacji systemów elektronicznych na wczesnym etapie projektowania. Na wczesnym etapie projektowania wciąż wiele parametrów jest nieznanych. Korzystając z optymalizacji wieloobiektowej, szybko widzimy wzorce najlepszych możliwych projektów, dla różnych „optymalnych” rozwiązań, niezależnie od rodzaju optymalności, na którą patrzymy. A jeśli próbka sprzętu jest już dostępna, możemy sprawdzić, jak daleko ta realizacja jest od optymalnego benchmarku. Oczywiście to, czego sztuczna inteligencja nie rozwiązuje, to sposób, w jaki ten optymalny zestaw parametrów jest konwertowany na rzeczywisty projekt 3D. Ale ponieważ można wygenerować wiele optymalnych projektów, możliwe jest szybkie znalezienie wykonalnego, który następnie okaże się zbliżony do optymalnego.
O ile szybszy w porównaniu z pełnofalowym modelem 3D jest model zastępczy? Kiedy staje się on bardziej wydajny niż 3D (wliczając w to początkowe obliczenia i czas szkolenia)?
Zysk czasowy jest ogromny. Ogólnie rzecz biorąc, istnieją cztery czynniki. Ważny jest czas oceny modelu fizycznego (jeśli jest on zbyt krótki, jak w przypadku szybkiej symulacji obwodu prądu zmiennego, LM nie jest potrzebny). Ważna jest również liczba potrzebnych danych treningowych. Trzeci z nich, czas na skonstruowanie surogatu, jest zwykle pomijalny w porównaniu z dwoma pierwszymi. A czas jego oceny jest szybszy. Mamy modele, które działają w ciągu 300 mikrosekund, niektóre zajmują kilka milisekund. Im więcej danych treningowych jest potrzebnych, tym wolniejsza jest ocena modelu LM. Średnio możemy uruchomić około 10 milionów próbek dziennie. Jest to całkowicie niemożliwe w przypadku modeli deterministycznych. Zasadniczo uważam model LM za kontener rozwiązań, a nie model.
Patrząc w przyszłość, jakie są kolejne kroki lub przyszłe zmiany w Twojej pracy?
Po pierwsze, chciałbym zobaczyć optymalne projekty, które zaproponowaliśmy. Jeśli uda nam się udowodnić, że dzięki LM możemy szybko znaleźć projekty, które przewyższają istniejące, to mamy doskonały dowód na korzyści płynące z LM. Pracujemy nad napędami elektrycznymi, a nasi partnerzy przemysłowi z pewnością będą czerpać rzeczywiste próbki sprzętu z naszych szacunków. Z niecierpliwością czekam na te próbki i ocenę ich wydajności.
Po drugie, jestem bardzo zainteresowany kalibracją modelu. Pracowaliśmy nad początkowymi, prostymi próbkami z bardzo obiecującymi wynikami. Następnie chcielibyśmy zastosować tę technikę do złożonych próbek sprzętu. Jestem naprawdę podekscytowany tym, czy uda nam się stworzyć modele EMC o wysokiej częstotliwości z dokładnością znacznie lepszą niż obecnie.
Wreszcie, jestem również bardzo zainteresowany szkoleniem modeli AI z ograniczeniami fizycznymi. Obecnie proces szkolenia jest czysto statystyczny; nasze modele AI nie są zbyt wyrafinowane i nie znają żadnych zależności fizycznych. Jest to dość nierozważne, biorąc pod uwagę, że rozwiązujemy równania Maxwella od ponad 150 lat. A teraz wyrzucamy te informacje za burtę i wszystko jest po prostu przypadkowe/losowe. Niedawno skonstruowaliśmy model LM, który rozumie prawo prądowe Kirchhoffa, które jest fundamentalnym prawem obwodów elektrycznych. Jest to metoda stochastyczna, ale możemy ją nauczyć, że niezależnie od tego, co przewiduje, suma prądów wszystkich węzłów zawsze wynosi zero. Jest to duży krok naprzód w wyposażaniu modeli LM w część deterministycznej wiedzy, którą oczywiście posiada każdy ludzki inżynier. Mam nadzieję, że włączając prawa fizyczne do treningu, możemy znacznie zmniejszyć liczbę danych treningowych. Jest to ważne w przypadku modeli o długim czasie uczenia. Te badania to świetna zabawa i są bardzo interesujące, więc nawet jeśli przed nami jeszcze długa droga, to jest to coś więcej niż świetne ćwiczenie akademickie.
Rozmawiała: Katie Corey, Dassault Systèmes