Im Projekt werden generische Ansätze auf Basis von KI und maschinellem Lernen für eine optimierte Abfrageverarbeitung über große RDF-Wissensgraphen erarbeitet, um die Entwicklung hochleistungsfähiger zentralisierter und verteilter Datenspeicherlösungen zu erleichtern. Ziel ist es, eine Reihe von W3C-standardkonformen Tools zu entwickeln, die eine optimierte SPARQL-Abfrageausführung auf zentralisierten und föderierten RDF-Wissensgraphen implementieren. Die zentralen Fragen sind: (1) Wie können die Ansätze von KI und des maschinellen Lernens für die SPARQL-Abfrageoptimierung sowohl in föderierten als auch in nicht föderierten Umgebungen genutzt werden?, (2) Wie werden Einbettungen für SPARQL-Abfragen erstellt?, (3) Welcher Ansatz des maschinellen Lernens führt zu einer besseren Abfragelaufzeitleistung? Der vorgeschlagene Ansatz nutzt maschinelles Lernen (ML), insbesondere Deep Reinforcement Learning (DRL), um die Abfrageausführungszeiten zu verbessern, indem eine optimale/nahezu optimale Verbindungsreihenfolge in Abfrageplänen ausgewählt wird. Dieser Ansatz basiert auf dem Erfolg von DRL bei der Optimierung relationaler Datenbankabfragen und seinem Potenzial, die Leistung in Triplestore-Umgebungen deutlich zu verbessern. Die wissenschaftliche Methode besteht aus folgenden Schritten: Abfragedarstellung: Umwandlung von SPARQL-Abfragen in Vektoreinbettungen, die als Eingaben für den DRL-Agenten dienen. Umgebungs- und Zustandsmodellierung: Integration von Attributen aus dem Knowledge Graph (KG) wie Größe und Kardinalität von Abfragevariablen mit den Einbettungen. Aktions- und Belohnungsdefinition: Aktionen in diesem Kontext beinhalten die Auswahl von Verknüpfungen aus dem nicht optimierten Abfrageplan. DRL-Agent-Training und Feedback: Unter Verwendung einer benutzerdefinierten GymUmgebung und Python-Bindungen für eine nahtlose Integration mit dem Triplestore verbessert der DRL-Agent seine Abfrageoptimierungsstrategie iterativ nach dem Feedback ausgeführter Aktionen.
Verbundprojekt: Maschinelles Lernen für die Optimierung von SPARQL-Abfragen über zentralisierte und verteilte RDF-Wissensgraphen; Teilprojekt: Maschinelles Lernen für die Optimierung von SPARQL Abfragen
            
                
                    Laufzeit:
                    01.11.2024
                    
                        - 31.10.2027
                    
                
            
            
                
                    Förderkennzeichen: 01QE2429B
                
            
            
            
        
			
				
						
								
									Koordinator: Universität Paderborn - Fakultät EIM-Informatik - Lehrstuhl für Data Science
								
						
				
    
    
                        
    
	
	
	
			
					
            
            
            
                
                    Verbund:
                    E! 5736 SPARQL-ML
                
            
            
            
                
                    Quelle:
                    Bundesministerium für Bildung und Forschung (BMBF)
                
            
            
				
					Redaktion:
					
					
              
                DLR Projektträger
              
						
				
            
			
				Länder / Organisationen:
				
					
					
				
					
					Vereinigtes Königreich (Großbritannien)
				
					
					
				
					
					
				
			
			
				Themen:
        
          
              
            
				
          
              
            
				
          
              
                Förderung
              
            
				
          
              
                Innovation