Wirkstofffindung mit der Hilfe von "Computational Intelligence"

Chemiker mit Hilfe von „Computational Intelligence“ bei der Wirkstofffindung zu unterstützen ist eine wichtige interdisziplinäre Aufgabe, mit der sich unser InnovAGe Promovend Patrick Echtenbruck in seiner Promotionsarbeit befasst.

Dipl. Inform. Patrick Echtenbruck Dipl. Inform. Patrick Echtenbruck (Bild: TH Köln)

Anfang Juni 2018 hat Patrick Echtenbruck seine Promotion, betreut durch  Prof. Dr. Boris Naujoks am Institut für Data Science Engineering, and Analytics (IDE+A), am Campus Gummersbach begonnen. Das Institut erforscht die grundlegenden Prozesse der Modellierung, Analyse und Optimierung, die mit Methoden aus den Bereichen „Computational Intelligence“ und „Data Science“ umgesetzt werden. Dabei stammen die eingesetzten Methoden auch aus den Bereichen Machine Learning und Data Mining sowie weiteren verwandten Gebieten.

„Ein Chemiker steht oft vor dem Problem, dass er eine unüberschaubare Größe von potentiellen Wirkstoffmolekülen vor sich hat, die auch für eine vollständige Analyse am Computer eine zu große Datenmenge darstellt“, so der Promovend Patrick Echtenbruck. In seiner Arbeit entwickelt er deshalb Methoden aus den oben genannten Bereichen, mit denen am Ende eine Ressourcen- und Zeitoptimierung für den Chemiker erreicht werden soll. Zusammengefasst unter dem Titel „A Multiobjective Approach to Classification in Drug Discovery” versucht er mathematische bzw. statistische Computer-Modelle für reale Probleme zu entwickeln, die dann z.B. dabei helfen, Vorhersagen zur Aktivität von Molekülen bzw. Wirkstoffen an Zielproteinen zu machen. Dies ermöglicht im weiteren Verlauf eine Prognose über deren Anwendbarkeit am Patienten. „Bei der Entwicklung von Wirkstoffen sind deren Synthetisierbarkeit auf der einen Seite und ihre Bioverfügbarkeit auf der anderen Seite für den Chemiker von großer Wichtigkeit. Das eine korreliert aber nicht immer positiv mit dem anderen. Wie findet man hier nun geeignete Wirkstoffkandidaten? Um diese Frage zu beantworten, nutze ich in meiner Arbeit mehrdimensionale Modelle, um eine möglichst optimale Gesamtlösung zu erhalten. Eines der von mir hierzu eingesetzten Modelle ist z.B. ein „random forest“, eine Aggregation von Entscheidungsbäumen. Um mit einer solchen Aggregation von Entscheidungsbäumen eine Klassifizierung durchzuführen wird ein Mehrheitsentscheid aller Bäume bestimmt. Mit „random forests“ lässt sich auch eine klassische Regression durchführen, in diesem Fall würden die Ergebnisse der einzelnen Bäume zum Beispiel durch ihren Mittelwert zu einem Ergebnis zusammengeführt. Ziel meiner Arbeit ist es, die Parameter für das Modell immer weiter zu optimieren, um so die Klassifikationsgüte zu maximieren. Hierzu wird ein evolutionärer Optimierungsalgorithmus verwendet. Neben der Zeitersparnis und der unterstützenden Entscheidungshilfe, die meine evolutionären Algorithmen dem Chemiker bieten, erlauben meine Modelle dem Chemiker außerdem, sich in Bereiche zu wagen, die er vielleicht von vornherein nicht auf dem Radar hatte“, erklärt der Promovend Patrick Echtenbruck sein Projekt.

Bislang arbeitet Patrick Echtenbruck bei der Entwicklung seiner Algorithmen vor allem mit Daten, die er von seinem Kooperationsparter Prof. Dr. Michael Emmerich vom „Leiden Institute of Advanced Computer Science“ (LIACS) der Universität Leiden erhalten hat. In dem interdisziplinär angelegten Projekt des Promovierenden ist in Zukunft geplant, auch Daten aus der InnovAGe Forschungsgruppe von Prof. Dr. Sherif El Sheikh direkt mit einzubeziehen.

„Die Berührung mit der Chemie und die Interdisziplinarität ist das, was mein Projekt für mich so spannend macht. Es handelt sich bei meiner Arbeit nicht um rein mathematische bzw. statistische Fragestellungen, sondern um konkrete Probleme aus der realen Welt. Am Ende kann ich mit Hilfe meiner Arbeit dazu beitragen Moleküle zu identifizieren, die dann in der Medizin tatsächlich Anwendung finden“, so der Promovend über das besondere an seinem Projekt.

Juli 2019

M
M