Biolodzy używają sztucznych sieci neuronowych do analizy danych w ramach eksperymentalnej metody zwanej MPRA, która bada DNA. Wykorzystując te informacje, naukowcy mogą stworzyć sieci, które przewidują, które molekuły kontrolują określone geny w procesie zwanym ekspresją genów.
W dobie „big data”, sztuczna inteligencja stała się ważnym sprzymierzeńcem dla naukowców. Na przykład algorytmy uczenia maszynowego pomagają biologom zrozumieć ogromną liczbę sygnałów molekularnych, które kontrolują funkcjonowanie genów. Jednak w miarę jak nowe algorytmy są opracowywane w celu analizowania jeszcze większej ilości danych, stają się one również coraz bardziej złożone i trudne do interpretacji. Z tego powodu naukowcy muszą projektować zaawansowane algorytmy uczenia maszynowego, które są łatwiejsze do zrozumienia.
Algorytmy te są rodzajem sztucznej sieci neuronowej (ANN). Zainspirowane sposobem, w jaki neurony łączą się i rozgałęziają w mózgu, ANN stanowią podstawę obliczeniową dla zaawansowanego uczenia maszynowego. I pomimo swojej nazwy, ANN nie są używane wyłącznie do badania mózgów.
Komórki nie potrzebują wszystkich białek przez cały czas. Zamiast tego, polegają na skomplikowanych mechanizmach molekularnych, które włączają lub wyłączają geny produkujące białka w zależności od potrzeb. Kiedy te regulacje zawodzą, zazwyczaj następują zaburzenia i choroby.
Niestety sposób, w jaki standardowe ANN są kształtowane na podstawie danych zebranych w ramach MPRA powoduje, że biolodzy mają trudności z interpretacją, w jaki sposób dochodzi do ekspresji genów.
Nowa metoda wypełnia lukę pomiędzy narzędziami obliczeniowymi a sposobem myślenia biologów. Jej twócy stworzyli własne ANN, które matematycznie odzwierciedlają powszechne w biologii pojęcia dotyczące genów i kontrolujących je cząsteczek. W ten sposób naukowcy zmuszają swoje algorytmy uczenia się maszynowego do przetwarzania danych w sposób zrozumiały dla biologów.