Abgeschlossene Arbeiten (Auswahl)

Masterarbeiten

Autor: Alexander Hellmann-Schweikardt

Betreuer: Tim Braun

Wintersemester 2024/25

Kurzzusammenfassung:

Diese Arbeit befasst sich mit der Entwicklung eines Frameworks zur Evaluierung des Einflusses von Scheduling Strategien auf Regelungssysteme in Echtzeitumgebungen anhand eines realen Versuchaufbaus. Traditionelle Regelkreise folgen deterministischen Read-Control-Write-Zyklen, jedoch wird diese Struktur durch Echtzeitscheduling aufgebrochen, wodurch Task-Interferenzen entstehen, die Stabilität und Leistung beeinträchtigen können. Das vorgeschlagene Framework kombiniert ein ressourcenbeschränktes STM32-System mit dem Real-Time Operating System (RTOS) ThreadX und einem Python-basierten Hub zur dynamischen Anpassung und Analyse von Regelungsparametern. Es wurden Aufgaben für Sensordatenerfassung, Berechnungen und Aktorsteuerung unter verschiedenen Scheduling-Strategien, einschließlich des Deadline-Miss-Aware Control (DMAC), implementiert. Erste Ergebnisse deuten auf mögliche Vorteile von DMAC-Strategien in ressourcenbeschränkten Umgebungen hin. Das Framework liefert wertvolle Einblicke für zukünftige Studien und kann auch als didaktisches Werkzeug genutzt werden, um Scheduling-Konzepte in Echtzeitsystemen anhand eines praktischen Versuchsaufbaus zu vermitteln.

Autor: Lukas Hartmann

Betreuer: Severin Brunner

Wintersemester 2024/25

Kurzzusammenfassung:

A timing attack attempts to learn secret information from the execution time of an encryption or decryption. This work explores timing attacks and countermeasures on AES and RSA implementations of state-of-the-art crypto-libraries: OpenSSL, mbedTLS, tinycrypt, LibTomCrypt and Botan. For the AES, there is the slow S-Box implementation which on the other hand does not leak much timing information. Furthermore, there is a fast table implementation that is susceptible to attacks on different rounds. The weakness of the table implementation is the cache behaviour that causes timing variation. The preferred option should be hardware-specific and constant-time implementations. For AES, the cryptographic hardware features are the best option as they are fast and secure. Most of the investigated libraries support these. They also include other countermeasures, however, this work shows that attacks are still possible in the right setting. In particular in embedded systems where hardware is constrained, libraries might not be able to use the advanced implementations. Furthermore, some countermeasures slow down performance. The RSA does not have tables that are influenced by cache behavior, instead it requires exponentiation on large numbers. There are several approaches to make this more efficient. However, data-dependent execution paths can lead to timing variation and information leakage. One way to protect these is to avoid the data-dependency and thus make the implementation constant time. Additionally, blinding defends timing attacks which is why it is used by default in the libraries. The investigated libraries show different implementations and some pay more attention to timing attacks than others. While it is hard to find a weakness in Botan, ways are shown to attack the other crypto-libraries.

Autor: Maximilian Rumpf

Betreuer: Alexander Stegmeier, Tilmann Unte

Wintersemester 2023/24

Kurzzusammenfassung:

Real-time Systems play an important role in various industries, including safety- critical ones such as power plants, the automotive sector, and aviation. This makes them attractive targets for adversaries. Existing attacks can be enhanced by gaining access to the real-time system’s schedule [Che+19]. This paper explores the concept of using power analysis to non-invasively extract task parameters and reconstruct the schedule for an embedded real-time system. We introduce a Setup for capturing power traces for a microcontroller running FreeRTOS. In addition, we present two techniques for identifying similar segments in a power trace and explain how to classify them and potentially map them to jobs and tasks.

Autor: Dominik Witoschek

Betreuer: Alexander Stegmeier

Wintersemester 2023/24

Kurzzusammenfassung:

In den 1990er Jahren schufen Kocher et al. mit ihrer grundlegenden Arbeit [KJJ99] ein Bewusstsein dafür, dass sichere kryptographische Verfahren allein nicht ausreichen, um die Gesamtsicherheit kryptographischer Systeme zu gewährleisten. Die physikalische Implementierung solcher Systeme führt zwangsläufig dazu, dass sensible Informationen über physikalische Seitenkanäle durchsickern. Power Analysis bezeichnet eine Klasse von Seitenkanalangriffe, bei denen die momentane Leistungsaufnahme eines Zielgeräts aufgezeichnet und anschließend analysiert wird. Instruktionen und Daten erzeugen charakteristische Leistungsprofile. Auf dieser Grundlage ist es möglich, Geheimnisse wie kryptographische Schlüssel aus Systemen zu extrahieren. Als Reaktion auf diese Angriffe haben sich zwei Klassen von Gegenmaßnahmen etabliert: Hiding und Masking. Während Masking in zahlreichen Arbeiten untersucht und optimiert wurde, findet sich zu Hiding-Gegenmaßnahmen vergleichsweise wenig wissenschaftliche Literatur. In diesem Zusammenhang verfolgt die vorliegende Arbeit zwei Ziele. Zum einen soll die minimalistische Kryptographiebibliothek Tinycrypt auf Robustheit gegenüber Power-Analysis-Angriffen untersucht werden. Dafür wird eine kryptographisches Gerät aufgesetzt und angegriffen. Zum anderen sollen softwarebasierte Gegenmaßnahmen mit Fokus auf Hiding untersucht werden. Dafür wird der aktuelle Forschungsstand softwarebasierter Gegenmaßnahmen aufgearbeitet. Von diesen Gegenmaßnahmen wird eine auf Hiding basierende ausgewählt und auf dem Zielsystem implementiert. Anschließend wird im Vergleich mit einer ungeschützten Implementierung die erzielte Schutzwirkung bewertet. Der zugrundeliegende Versuchsaufbau für beide Ziele wird mithilfe der ChipWhisperer-Plattform realisiert. Diese Plattform bietet eine kosteneffiziente Integration der für Power- Analysis erforderlichen Werkzeuge und bildet einen reproduzierbaren Versuchsaufbau. Diese Arbeit zeigt, dass softwarebasierte Hiding-Gegenmaßnahmen zwar eine erhöhte Resistenz gegen Power-Analysis-Angriffe bieten, jedoch abhängig von der Implementierung und Hardware unterschiedlich effektiv sind.

Autor: Johannes Kühbacher

Betreuer: Tilmann Unte

Wintersemester 2023/24

Kurzzusammenfassung:

Ein in den letzten Jahren zunehmend an Interesse gewinnendes Ziel ist die autonome Fortbewegung von Fahrzeugen und Robotern. In diesem Kontext werden Algorithmen benötigt, die eine Lokalisierung und eine anschließende Wegfindung ermöglichen. Einer dieser Lokalisierungsalgorithmen ist die Monte-Carlo-Lokalisierung, die die Position und Ausrichtung eines Roboters mittels stochastischer Verfahren bestimmt. Im Rahmen der Arbeit wurde diese erprobt, indem ein Roboter sich selbständig innerhalb eines Gebäudes lokalisiert, wodurch anschließend eine Wegfindung von der aktuellen Roboterposition zu einem Zielpunkt möglich ist. Die Monte-Carlo-Lokalisierung setzt dabei voraus, dass der Roboter in der Lage ist seine Umgebung wahrzunehmen, weshalb dieser mit verschiedenen Abstandssensoren in Form von Ultraschall- und Lasersensoren ausgestattet wurde. Die Messwerte der Sensoren werden durch einen Sensorfusionsansatz kombiniert, damit das Verfahren weniger fehleranfällig ist. Dies ist dahingehend wichtig, um die Schwächen der beiden Sensortypen auszugleichen, wie zum Beispiel möglichen Crosstalk der Ultraschallsensoren. Auch hat es sich in praktischen Versuchen gezeigt, dass der Lasersensor für Glaswände, welche in dem Testflur des Gebäudes zu finden sind, keine zuverlässigen Messwerte liefert. Diese Schwäche wird durch die Ultraschallsensoren ausgeglichen. Anhand weiterer simulierter und praktischer Versuche wurde zudem die Lokalisierung in verschiedenen Anwendungsgebieten innerhalb des Testflurs überprüft. Diese haben gezeigt, dass sich das Verfahren für eine lokale Lokalisierung, bei der Vorwissen über die Position des Roboters vorhanden ist, eignet, jedoch eine globale Lokalisierung, bei der kein Vorwissen gegeben ist, nur teilweise möglich ist.

Autor: Severin Brunner

Betreuer: Alexander Stegmeier, Christian Piatka

Wintersemester 2022/23

Kurzzusammenfassung:

Viele eingebettete Echtzeitsysteme besitzen Sicherheitsanforderungen, welche eine Verschlüsselung oder Authentifizierung der zu verarbeitenden Daten erfordern. Um die entsprechenden Algorithmen schneller ausführen zu können und um den Haupt- prozessor zu entlasten, kann ein Hardwarebeschleuniger verwendet werden. Jedoch müssen die maximalen Antwortzeiten des Hardwarebeschleunigers bestimmbar sein, um die zur Verifizierung von Echtzeitsystemen erforderliche Worst Case Execution Time (WCET) von Programmen, die den Hardwarebeschleuniger verwenden, be- rechnen zu können. In dieser Arbeit wird ein für den Einsatz in Echtzeitsystemen konzipierter Hardware- beschleuniger entwickelt, welcher den Verschlüsselungsalgorithmus AES in Kombina- tion mit verschiedenen Betriebsmodi zur Verschlüsselung und Authentifizierung aus- führen kann. Der Hardwarebeschleuniger wird dabei ähnlich wie ein Direct Memory Access (DMA) mit der Quell- und Zieladresse sowie der Länge der zu verschlüsseln- den Daten programmiert und führt die entsprechenden Speicherzugriffe zum Lesen und Schreiben der Daten eigenständig durch. Zudem verfügt der Hardwarebeschleu- niger über ein Kanalsystem, das die Verwaltung mehrerer Verschlüsselungsaufgaben ermöglicht. Die Aufgaben werden entsprechend einer gegebenen Priorisierung der Kanäle sequenziell abgearbeitet. Um für eine große Breite an Anwendungsfällen eine gute Lösung bereitzustellen, wird der Hardwarebeschleuniger in zwei Varianten implementiert. Bei der ersten Variante wird der Fokus auf eine hohe Ausführungsgeschwindigkeit gelegt, die zweite Vari- ante optimiert den Hardwarebeschleuniger bezüglich seiner Hardwareeffizienz. Das Design wird mittels der Xilinx Zynq-7000-Plattform getestet. Die Varianten werden abschließend im Rahmen einer Evaluation bezüglich ihrer Hardwareeffizienz und Geschwindigkeit miteinander verglichen. Zudem wird das zeitliche Verhalten analysiert und anhand der Analyseergebnisse ein Algorithmus zur Berechnung der maximalen Antwortzeiten aufgestellt.

Autor: Jakob Brügmann

Betreuer: Florian Haas

Sommersemester 2022

Kurzzusammenfassung:

Das ADMORPH Projekt beschäftigt sich mit echtzeitfähigen Systemen, die sich dynamisch an die Umwelt anpassen [20]. Das untersuchte System führt Datenflussgraphen aus. Eine Hilfe zur flexiblen Entscheidung zwischen Zweifach- und Dreifachausführung wird in dieser Arbeit geschaffen. Diese beiden Redundanzmechanismen schützen die Aktoren der Programme gegen Fehler. Aktoren stellen die Berechnungseinheiten in den auszuführenden Datenflussgraphen dar. Um die Entscheidung zu ermöglichen wird ein Algorithmus zur automatischen WCET Analyse erstellt. Die Berücksichtigung der Ausfälle durch Fehler findet für die WCET statt, bis zu einer festgelegten Wahrscheinlichkeit ist diese garantiert. Um die obere Schranke beweisen zu können, werden alle möglichen Kombinationen an Wiederholungen der Aktoren erstellt und deren WCET bestimmt. Da das System nicht präemptiv ist müssen verschiedene Blockierungen berücksichtigt werden. Wichtig ist es, durch logische Ausschlusskriterien möglichst viele Blockierungen auszuschließen. Zusätzlich werden zwei Heuristiken erarbeitet, um eine schnellere Selektion der zu verwendenden Hardware zu ermöglichen. Die Auswertung der Algorithmen erfolgt anhand mehrerer Beispielprogramme. Dabei beweist sich der komplexe Algorithmus zur Bestimmung der WCET. Es wurden erfolgreich logische Zusammenhänge gefunden, um die WCET zu reduzieren. Aufbauend werden Verbesserungen am Ausführungssystem vorgeschlagen. Als effektiv erweist es sich, die Anzahl an möglichen Blockierungen zu reduzieren. Dies ermöglicht eine deutlich bessere WCET, ohne einen signifikanten Nachteil für die Ausführung im fehlerfreien Fall.

Autor: Thomas Kügle

Betreuer: Christian Piatka, Florian Haas

Wintersemester 2020/21

Kurzzusammenfassung:

Die Arbeit befasst sich mit der Konzipierung eines Hardwaretransaktionsspeichers für den Echtzeitbetrieb. Im Laufe der Arbeit wird ein Transaktionsspeicher um unterschiedliche Konzepte erweitert. Diese dienen dazu, den Abbruch von Transaktionen, welche eine feste Zeitschranke benötigen, zu verhindern. Zusätzlich soll somit eine Vorhersage über das Verhalten des Transaktionsspeichers vereinfachen werden. Um Abbrüche von höher priorisierten Tasks zu verhindern, werden prioritätsbasierte Transaktionen eingeführt. Außerdem werden unterschiedliche Möglichkeiten implementiert, um den Abbruch durch Kapazitätskonflikte zu verhindern. Des Weiteren wurden alle Konzepte in verschiedenen Varianten des Transaktionsspeichers evaluiert. Für die Evaluation werden die einzelnen Varianten im GEM-5-Simulator implementiert und über unterschiedliche Benchmarks miteinander verglichen. In einem Vergleich mit den Ergebnissen der Stamp-Benchmarks in anderen Systemen wird die Validität des Transaktionsspeichers bestätigt. Zudem wird der Hardwareaufwand einzelner Modifikationen abgeschätzt sowie deren Echtzeitverhalten betrachtet.

Autor: Tilmann Unte

Betreuer: Alexander Stegmeier

Sommersemester 2020

Kurzzusammenfassung:

Der RC/MC Prozessor hat die Zielsetzung den hohen Ansprüchen an eingebettete Systeme durch nachrichtenbasierte Parallelität und Echtzeitfähigkeit zu begegnen. Dazu werden sehr viele einfache Prozessorkerne mit dem Paternoster NoC verbunden. Jedem Kern werden anhand von periodischen TDM Schedules Sendeslots für die Kommunikation zur Verfügung gestellt. Dadurch wird es ermöglicht für parallele Programme die WCET zu analysieren. Doch die Anbindung an das Netzwerk über Sende-- und Empfangspuffer hat bisher hohe Hardwarekosten erzeugt. Weiterhin werden die Kerne mit der Verwaltung der Puffer ausgelastet und die TDM Sendeslots können teilweise nicht optimal genutzt werden. Zur Lösung dieser Probleme wird in dieser Arbeit eine echtzeitfähige DMA Schnittstelle entworfen, die den Router direkt an den lokalen Speicher anschließt und das Senden und Empfangen von Nachrichten automatisiert. Dadurch können die Puffer komplett ersetzt werden und der Prozessorkern wird entlastet. Die DMA Schnittstelle wird auf zwei verschiedene Arten für den Alternate Schedule implementiert. Die beiden Implementierungen werden anhand ihrer Hardwarekosten und den Ergebnissen von Microbenchmarks ausgewertet und miteinander verglichen.

Bachelorarbeiten

Autor: Marina Fuchs

Betreuer: Tilmann Unte

Wintersemester 2024/25

Kurzzusammenfassung:

Accurate position and orientation estimation is essential for mobile robots, particularly in indoor environments where GPS is unavailable. This thesis explores odometry using rotary encoders and an Inertial Measurement Unit (IMU) to estimate a robot’s movement. Since both sensor types have inherent limitations - drift and noise in the IMU and mechanical inaccuracies in the encoders - sensor fusion is applied to improve accuracy. The study begins by preparing and analyzing the raw sensor data, addressing issues such as bias correction, noise filtering, and coordinate transformations. To compare IMU- and encoder-based positioning, various movement scenarios are tested, including linear motion, combined rotations, and special cases where the robot is stuck or collides with a wall. The Extended Kalman Filter (EKF) is implemented to fuse both sensor sources, leveraging their strengths while minimizing individual errors. Results show that while sensor fusion enhances accuracy, certain fundamental errors, such as drift in the IMU and deviations caused by the PID controller, remain. Additionally, detecting abnormal conditions, such as getting stuck, is crucial for preventing erroneous position updates. The findings highlight that IMU and rotary encoder fusion is a valuable approach for motion estimation, but further improvements can be achieved through calibration, fine-tuning of filtering techniques, and integrating additional external sensors such as LiDAR or camera-based tracking. With the necessary foundations established, the developed framework provides a solid basis for future optimization and real-world implementation.

Autor: Robin Wolf

Betreuer: Sebastian Altmeyer

Sommersemester 2024

Kurzzusammenfassung:

Das Thema der Arbeit lautet "Visualisierung, Analyse und Generierung von Cache- Zugriffen". Ziel ist es, eine Anwendung zu entwickeln, die Cache-Zugriffe visualisiert und Sequenzen mit vorgegebenen Hit-Raten erzeugt. Dazu wurde untersucht, wie eine Sequenz erstellt werden kann, die auf einem Cache eine bestimmte Hit-Rate besitzt. Zudem wurde betrachtet, wie gut sich Sequenzen finden lassen, die auf mehreren Caches jeweils zu einer bestimmten Hit-Rate führen. Diese Arbeit trägt dazu bei, Methoden für die Generierung von Cache-Zugriffssequenzen zu erstellen und zu diskutieren. Um diese Ziele zu erreichen, wurden verschiedene Algorithmen entwickelt und ausgewertet. Im Kern wurden drei Algorithmen erarbeitet, welche in verschiedenen Abwandlungen diskutiert werden. Der erste Algorithmus erstellt zufällig eine Cache- Zugriffssequenz und überprüft, ob diese die gewünschten Eigenschaften besitzt. Der zweite Algorithmus sucht systematisch nach passenden Sequenzen und wird von einem Brute-Force-Algorithmus zu einem Branch-and-Bound-Algorithmus weiterentwickelt. Der dritte Algorithmus nutzt Wahrscheinlichkeiten für Cache-Hits und Cache-Misses, um Sequenzen zu erstellen. Um die Algorithmen zu testen, wurde eine Anwendung implementiert, die die Algorithmen umsetzt. Die Ergebnisse zeigen, dass das Suchen nach Adressen und Sequenzen, egal ob zufällig oder systematisch, bei steigender Adressbreite und Sequenzlänge in Bezug auf die Laufzeit an Grenzen stößt. Dennoch bieten diese Methoden einfache und erweiterbare Lösungen für unterschiedliche Cache-Organisationen und Verdrängungsstrategien. Der probabilistische Ansatz wurde nur für das Finden einer Sequenz untersucht, die auf einem Cache eine bestimmte Hit-Rate besitzen muss. Dieser erwies sich als besonders viel versprechend, da er auch bei großen Sequenzlängen und Adressbreiten effizient skaliert.

Autor: Simon Güller

Betreuer: Severin Brunner

Sommersemester 2024

Kurzzusammenfassung:

Fault attacks are a powerful instrument used by adversaries to break the security of embedded devices. In response, many vendors try to prevent these attacks with software countermeasures. In this thesis, we address the need to evaluate the effectiveness of various countermeasures against fault attacks in embedded systems. An attack can consist of multiple faults, further complicating the defensive measures. Given the criticality of hardware security and the evolving nature of fault attacks, this thesis focuses on the challenges posed by the combination of multiple fault injections, leading to an exponentially growing search space for potential attacks. We develop a custom-built fault simulator to model and analyze fault attacks. The methodology for simulating faults, including glitches or bitflips, is clearly outlined. It demonstrates how the number of possible attacks scales exponentially with the number of injected faults. A key evaluation metric, the success rate, is defined to analyze the effectiveness of countermeasures by the ratio of successful attacks to the total number of executed attacks. Using this metric, various countermeasures in a secure boot protocol are evaluated, revealing patterns in the instructions targeted by successful attacks. This analysis shows that some instructions are targeted more frequently than others. A probability model for instructions is introduced, determining the likelihood that targeting a specific instruction will lead to a successful attack. This model enables the conceptualization of attacks as sequences of targeted instructions, each with an assigned probability of success. Leveraging these insights, we develop two methods for search space restriction to manage the exponentially growing number of possible attacks. The best-performing method increases the success rate of attacks by a factor of 26.4 compared to random instruction targeting. In conclusion, this thesis provides valuable insights into fault attacks and countermeasures, emphasizing the need for efficient search space restriction methods in the context of multi-fault scenarios.

Autor: Antonia Geßwein

Betreuer: Tilmann Unte

Sommersemester 2024

Kurzzusammenfassung:

Für ein autonomes Fahrzeug wie einen mobilen Roboter spielt die Wahrnehmung der Umgebung eine zentrale Rolle. Damit sich der Roboter sicher durch sein Umfeld bewegen kann, muss er Hindernisse erkennen können. Im nächsten Schritt wäre es möglich, um die festgestellten Hindernisse herumzufahren. Das Ziel dieser Arbeit ist der Entwurf eines Algorithmus zur Hinderniserkennung. Ein naheliegender Ansatz, um Hindernisse detektieren zu können ist, den Abstand zu umliegenden Objekten zu messen. Zur Distanzmessung wird in dieser Arbeit ein Lidar Sensor verwendet. Anschließend werden diese Messdaten mithilfe eines Clustering-Algorithmus in Gruppen sortiert, um einzelne Hindernisse zu identifizieren. Nach der Gruppierung der aufgenommenen Daten ist eine Verbindung der einzelnen Messpunkte zu einem zusammenhängenden Hindernis notwendig, damit beispielsweise eine Wand darstellbar ist. Da Hindernisse auch ungewöhnlich geformt sein können, muss zusätzlich überprüft werden, ob sie Ecken enthalten, weil dann die bisherige Repräsentation das Hindernis eventuell nicht mehr akkurat abbilden kann. Der in dieser Arbeit vorgestellte Algorithmus zur Hinderniserkennung wird anschließend noch bezüglich seiner Ausführungszeit getestet. Außerdem findet eine Überprüfung statt, wie spitz ein Winkel sein kann, bevor Probleme bei der Eckenerkennung auftreten. Ein abschließender Test vergleicht die vom Algorithmus berechneten Hindernisse mit der real vorhandenen Umgebung, um festzustellen, wie gut die Berechnungen die Realität abbilden.

Autor: Marc Stowasser

Betreuer: Sebastian Altmeyer

Wintersemester 2023/24

Kurzzusammenfassung:

In der aktuellen Zeit spielt Mobile Gaming eine große Rolle. Die meisten Menschen benutzen dabei ihr Smartphone oder tragbare Spielenkonsolen. Mittlerweile können technisch anspruchsvolle Videospiele auf diesen Geräten ausgeführt werden. Die Entwickler müssen sich größtenteils mit Herausforderungen, wie der Hardware-Vielfalt oder der raschen technologischen Entwicklung, stellen. In den Anfängen des Mobile Gaming mussten sich die Entwickler jedoch mit anderen Problemen auseinandersetzen. Dazu zählen die Tragbarkeit der Konsole, die Batterielaufzeit oder auch die begrenzten Ressourcen. Bei der Entwicklung des Gameboy wurden die eben genannten Probleme durch innovative Hardware gelöst. Die folgende Fallstudie des Gameboy analysiert die Hardware der Konsole und betrachtet die Lösungen für die einzelnen Teilbereiche.

Autor: Sebastian Stecher

Betreuer: Tilmann Unte

Sommersemester 2022

Kurzzusammenfassung:

Es wird die Leistung herkömmlicher, günstiger Ultraschallsensoren in Verwendung zur Hindernisserkennung an einem fahrerlosen Transportsystem (FTS) untersucht. Dazu werden die Ultraschallsensoren, in einer ihren Eigenschaften entsprechenden Formation, am FTS montiert. Um der Fehleranfälligkeit roher Messungen entgegenzuwirken und robustere Messergebnisse zu erhalten, wird eine angepasste Variante des eindimensionalen Kalman-Filter entwickelt und eingesetzt. Die Leistung des Systems wird zuletzt anhand einiger praktischer Versuche überprüft und optimiert. Dabei zeigt sich die Eignung des Kalman-Filter zur Filterung von Ultraschalldistanzmesswerten im untersuchten Teilbereich der Robotik. Das implementierte System eignet sich zur Hindernisserkennung von Wänden und Hindernissen ab einer Mindestgröße im Innenraum oder zur additiven Verwendung in einem bereits bestehenden Hindernisserkennungssystem.

Autor: Steffen Beschta

Betreuer: Alexander Stegmeier

Sommersemester 2022

Kurzzusammenfassung:

Ein Gerät durch Manipulation dazu zu bringen, einen Befehl falsch auszuführen, ist eine häufig verwendete Strategie, um ein vom Hersteller nicht geplantes Verhalten auszulösen. Einer dieser Ansätze, das Voltage Glitching, wird in dieser Arbeit näher untersucht. Das Ziel ist es hierbei, die Debug-Funktionalität des Versuchsobjektes entgegen der eigentlichen Konfiguration zu aktivieren, indem während des Starts des Mikrocontrollers die Versorgungsspannung für einen kurzen Zeitraum kurzgeschlossen wird. Hierfür werden zunächst die notwendigen Parameter bestimmt und ein Versuchsaufbau erläutert, der auf der kommerziell verfügbaren ChipWhisperer Plattform basiert. Anschließend wird ein weiterer Versuchsaufbau dargestellt, bei dem ein Galliumnitrid Transistor verwendet wird. Beide Versuchsaufbauten werden auf ihre Erfolgswahrscheinlichkeiten und ihren Spannungsverlauf hin verglichen. Trotz Optimierungen am Versuchsaufbau konnte jedoch durch Einsatz eines anderen Transistors kein besseres Ergebnis als mit dem ChipWhisperer erzielt werden. Die Verwendung von dickeren Drahtbrücken zur Verbindung der Komponenten führte zwar zu einem stark optimierten Spannungsverlauf, die Erfolgswahrscheinlichkeit wurde hierdurch jedoch reduziert. Die beste Erfolgsrate resultierte aus dem Kurzschließen der Kernspannung mit einer Spannung, die leicht über dem Nullpotential liegt.

Autor: Felix Heptner

Betreuer: Christoph Kühbacher

Wintersemester 2021/22

Kurzzusammenfassung:

Die Adaptive Redundancy on Manycore Architectures (ARoMA) RTE ist ein datenflussgraphbasiertes Multicore-Framework mit Fokus auf eingebetteten Systemen. Die ARoMA Runtime Environment (RTE) kann gleichzeitig hohe Performance durch Parallelisierung und Sicherheit durch spezielle Redundanzfeatures bieten. Teil des Frameworks ist ein eigenes funktionales Programmiermodell, das auf C++ basiert und sich mit konventionellen C++-Compilern kompilieren lässt. Aus einem Programm, welches im ARoMA Framework geschrieben wurde, wird, ähnlich wie in Tensorflow, vör tatsächlicher Laufzeit ein Graph konstruiert. In Zukunft sollen die Redundanzkonfigurationen einzelner Abschnitte eines solchen Anwendungsgraphen adaptiv zur Laufzeit von der RTE angepasst werden können. Diese Arbeit legt die Basis für solch ein Modul, indem sie sich damit befasst, wie Directed Acyclic Graph (DAG)s durch Graphalgorithmen, den Anforderungen der RTE entsprechend, unterteilt werden können.

Autor: Anton Lydike

Betreuer: Tilmann Unte

Sommersemester 2021

Kurzzusammenfassung:

Creating a new operating system might seem like a daunting task to some. Gaining a deeper understanding of the inner workings of operating systems is a critical step in reducing the anxiety often associated with such an undertaking. This thesis attempts to show, how an operating system might not be as complex as it seems from the outside. To accomplish this, we break down the abstract concepts of an operating system and define a minimal operating system. EMBARK, the kernel created for this thesis, is a minimal implementation of such a definition which aims to give a platform to students to build upon. As RISC-V is the architecture used by the University Augsburg, it is the target architecture for the kernel. This thesis will explain how EMBARK works internally, and explore the three parts which make up this kernel. Then the kernel is tested and validated using a RISC-V emulator, which was also written as part of this thesis.

Autor: Paul Burchard

Betreuer: Christian Piatka

Sommersemester 2020

Kurzzusammenfassung:

Zunächst werden verschiedene Verfahren zur Ausführbarkeitsanalyse von periodischen Taskmengen vorgestellt, erklärt und in Form von Algorithmen dargestellt. Weiterhin wird ein Verfahren entwickelt, dass in der Lage ist Taskmengen zu generieren, wobei spezifische Parameter variiert werden können. Neben der Festlegung von unter anderem der gewünschten Prozessorauslastung oder der Anzahl der Tasks, kann insbesondere auch gewählt werden, durch welche Scheduling Policies eine Taskmenge aus- und unausführbar sein soll. Die dafür entwickelten Algorithmen werden veranschaulicht und erklärt. Im späteren Verlauf der Arbeit wird die durchschnittliche Dauer der Generierung einer Taskmenge unter Verwendung verschiedener Parameter evaluiert. Als längste verzeichnete Durchschnittslaufzeit ergaben sich dabei 225 Millisekunden. Allerdings dauert die Generierung für die meisten evaluierten Parameter weniger als eine Millisekunde im Durchschnitt. Daraus folgt, dass sich für den Anwender im Regelfall kaum eine Verzögerung bemerkbar macht.

Autor: Axel Böll

Betreuer: Christian Mellwig

Sommersemester 2020

Kurzzusammenfassung:

Die ARoMA Laufzeitumgebung implementiert ein an Apache Spark angelehntes MapReduce Programmiermodell (RAPID) auf C++ Basis. Im Zentrum stehen dabei Datenpartitionen auf denen parallele MapReduce-Operationen angewendet werden. Durch die datenparallele Programmierung kann gezielt Datenlokalität vom Programmierer genutzt werden, um die Ausführung paralleler high-performance Anwendungen auf eingebetteten Systemen zu realisieren. Dynamic Programming und Structured Grid sind dabei zwei Berkeley Dwarfs, also zwei Klassen von parallelen Programmen, welche durch die Algorithmen Pathfinder und ParticleFilter der Rodinia Benchmark Suite repräsentiert werden. Ziel dieser Bachelorarbeit ist es, die Applikationen Pathfinder und ParticleFilter der Rodinia Benchmark Suite von OpenMP auf das RAPID Programmiermodell zu portieren und deren Laufzeit mit der ARoMA Laufzeitumgebung zu evaluieren. Ein Augenmerk soll dabei auf dem Vorgang der Portierung selbst liegen um allgemeine Portierungsprobleme von Dynamic Programming und Structured Grid Algorithmen aufzudecken und zu untersuchen. Da die Speicherzugriffsmuster der OpenMP Implementierung auf shared-memory Architekturen zugeschnitten ist, müssen Datenabhängingkeiten analysiert werden und die Algorithmen so abgeändert werden, dass eine Aufteilung der Daten auf nicht geteilte Speicherbereiche möglich ist.

Autor: Darko Jankovic

Betreuer: Christoph Kühbacher

Sommersemester 2020

Kurzzusammenfassung:

CUDA bietet eine weit verbreitete Möglichkeit zur massiv parallelen Ausführung von Programmen an. Verwendet wird dafür die GPU-Architektur, und das Feature-Set einer Grafikkarte wurde für nicht mehr nur Video- und 3D-spezifische, sondern nunmehr allgemeine Berechnungen erweitert. Für Programmiermodelle, die zumindest theoretisch von dieser Parallelität Gebrauch machen können, eröffnet sich eine Möglichkeit zur Beschleunigung von Programmen, die bisher nur auf einem konventionellen x86-Multicore-Prozessor liefen. Das Modell, mit dem sich diese Arbeit beschäftigt, heißt RAPID: Es fasst Programme als Graphen auf und stellt damit Datenflüsse und Operationen auf Daten einheitlich dar. Das ARoMA-RTE, das eine Laufzeitumgebung in C++ für dieses Modell bereitstellt, lief bislang nur auf der CPU. In dieser Arbeit wird untersucht, ob die Portierung einiger Funktionen des RTEs auf CUDA-ausführung praktikabel ist und sich in Performancegewinnen äußert. Dabei wird nicht nur eine rudimentäre erste Version erstellt, sondern diese auch mit verschiedenen Mitteln optimiert, die die Graphical Processing Unit (GPU) zur Verfügung stellt. Testreihen bestätigen bereits bei der unoptimierten Fassung „CUDA-naive“ einen enormen Performance-Zuwachs im Gegensatz zur reinen Central Processing Unit (CPU)-Ausführung. Synthetische Tests der einzelnen Operationen wie auch der Monte-Carlo-Algorithmus zur probabilistischen Bestimmung von Pi messen deutlich kürzere Ausführungszeiten. Allerdings wird dabei noch nicht das volle Potential der Grafikkarte ausgeschöpft: Mit der Nutzung von Unified Memory, Shared Memory und asynchroner Ausführung soll weiter versucht werden, die Grafikkartenausführung zu optimieren. Zum Schluss wird eine Wertung über die Maßnahmen sowie weitere Möglichkeiten gegeben.

Projektmodule

Durchführung: Tobias Drexl

Betreuer: Tilmann Unte

Wintersemester 2021/22

Kurzzusammenfassung:

Die Aufgabe des Projektmoduls bestand in der Implementierung einer Antriebssteuerung für ESTHER. Die Anforderungen an diese Steuerung waren in erster Linie Beschleunigung und Bremsen so zu dämpfen, dass der Roboter nicht ins Schleudern geraten kann. Weiterhin sollten sowohl Kurven, als auch auf der Stelle drehen unterstützt werden. Die Roboteranwendung wurde mit Hardware Watchdogs abgesichert.

Durchführung: Thomas Kügle

Betreuer: Christian Piatka, Florian Haas

Sommersemester 2020

Kurzzusammenfassung:

Die Aufgabe des Projektmoduls bestand in der Implementierung eines Skripts für den gem5-Simulator. Dieses Skript sollte es erlauben unkompliziert eine Simulation eines RISC-V Multicore-Systems im Baremetal-Modus durchzuführen. Des Weiteren sollte die Multicore-Funktionalität der RISC-V Implementierung untersucht, sowie deren Korrektheit evaluiert werden. In einem letzten Schritt wurde die Möglichkeit betrachtet den gem5 Cache um einen Transaktionsspeicher zu erweitern.

Forschungsmodule

Durchführung: Paul Oberosler

Betreuer: Johannes Kühbacher

Wintersemester 2024/25

Durchführung: Ohan Melkonyan

Betreuer: Tilmann Unte, Johannes Kühbacher

Sommersemester 2024

Durchführung: Vinzenz Malke

Betreuer: Tilmann Unte

Wintersemester 2022/23

Kurzzusammenfassung:

Im Rahmen dieses Froschungsmoduls wurde ein Treiber für ein Slamtech RPLIDAR für das Zephyr Echtzeitbetriebssystem entwickelt. Zu den Herausforderungen gehörte eine anwenderfreundliche Abstraktion der Kommunikation mit dem Sensor, sowie der komplexen Konfigurationsmöglichkeiten. Der Treiber wurde anhand mehrerer Testprogramme sorgfältig erprobt und kann in Zukunft beispielsweise im Rahmen des ESTHER-Projekts weiterverwendet werden.

Durchführung: Dominik Witoschek

Betreuer: Alexander Stegmeier

Wintersemester 2022/23

Kurzzusammenfassung:

AES ist ein weitverbreiteter Verschlüsselungsalgorithmus und wird von eingebetteten Systemen im höheren Preissegment mittlerweile oft hardwareseitig unterstützt. Der Forschungsgegenstand dieser Arbeit ist der dedizierte AES-Beschleuniger eines solchen Mikrocontrollers. Das Ziel ist die möglichst präzise Erfassung des Zeitverhaltens für die verschiedenen angebotenen Features. Dazu zählen verschiedene Operationen, Schlüssellängen, Methoden zum Datentransfer und die Möglichkeit, Vorgänge zu unterbrechen sowie fortzusetzen.

Durchführung: Sophia Hofbauer

Betreuer: Christian Piatka

Sommersemester 2022

Kurzzusammenfassung:

Im Rahmen dieses Froschungsmoduls wurde ein Onlinetool entwickelt, das die May- und Must-Analyse (Verfahren um Cache Misses bzw. Cache Hits vorherzusagen) auf vorgegebenen Graphen durchführen kann. Ein potenzieller Benutzer hat hierbei die Möglichkeit, einen aus sechs verschiedenen Graphen auszuwählen. Der Benutzer hat weiter die Möglichkeit, die Knoteninhalte der Graphen zu ändern. Das Tool erlaubt es, die Lösungen samt Graphen als LaTeX-Code herunterzuladen.

Durchführung: Steffen Beschta

Betreuer: Alexander Stegmeier

Sommersemester 2021

Kurzzusammenfassung:

Im Rahmen dieses Forschungsmoduls wurde eine Umgebung zur Ermittlung des taktgenauen Zeitverhaltens von Instruktionen realisiert und Microbenchmarks zur Ermittlung der Dauer einzelner Instruktionen in verschiedenen Ausführungkontexten implementiert. Anschließend wurde die entsprechenden Zeiten gemessen und anhand der vorliegenden Dokumentation verifiziert.

Lehrstuhl für Embedded Systems

Abgeschlossene Arbeiten (Auswahl)

Masterarbeiten

Framework zur Evaluation vom Einfluss des Schedulers auf einem Regelkreis

Exploring Timing Attacks on Crypto-Libraries in Embedded Systems

Utilizing Power Analysis To Extract Task Parameters From Embedded Real-Time Systems

Untersuchung der Robustheit von AES Implementierungen gegenüber Attacken mittels Power Analysis

Sensorfusion zur robusten Monte-Carlo-Lokalisierung eines mobilen Roboters

Entwicklung eines AES-Hardwarebeschleunigers für Echtzeitsysteme

Scheduling-Analyse fehlertoleranter Datenflussanwendungen

Untersuchung der Echtzeitfähigkeit von Transaktionsspeicher in eingebetteten Systemen

Echtzeitfähiger DMA Controller für ein TDM-basiertes Network-on-Chip

Bachelorarbeiten

Enhancing Robot Odometry with IMU-Based Sensor Fusion

Visualisierung, Analyse und Generierung von Cache-Zugriffen

Simulation-based Verification of Software Measures against Glitch Attacks

Hinderniserkennung mithilfe eines Lidar-Sensors für einen mobilen Roboter

Der Game Boy als Fallstudie zum hardware-nahen Aufbau eines Computersystems

Der Kalman-Filter für Ultraschallsensoren in der Robotik

Voltage Glitching zum Auslesen von Firmware ARM-basierter Mikrocontroller

Identifikation geeigneter Programmstellen zur automatischen Rekonfiguration in Graph-basierten Anwendungen

EMBARK: An Educational and Modifiable BAsic RISC-V Kernel

Bereitstellung von Schedulabilitytests und bedingte Erzeugung von Task-Sets

Untersuchung der Portierbarkeit von Dynamic Programming und Structured Grid Algorithmen auf die ARoMA Laufzeitumgebung

GPU-unterstützte Ausführung von Programmen auf der ARoMA-Laufzeitumgebung

Projektmodule

ESTHER: Antriebssteuerung und Watchdogs

Gem5 Multicore (RiscV)

Forschungsmodule

Entwicklung eines Embedded System Demonstrators unter Verwendung eines RasPi Pico 2

Entwicklung eines LPDL-Generators

Slamtech RPLIDAR Treiberentwicklung für Zephyr

Evaluierung des Zeitverhaltens eines AES-Beschleunigers

Cache-Analyse

Verifizierung des Timings von load und store Instruktionen eines STM32L475 Mikrocontrollers

Suche