Home › Companies › Macaw › (Semantic) Data Engineer (m/w/d)
(Semantic) Data Engineer (m/w/d)
Macaw · Wuppertal · Active · Personio
Job facts
| Field | Value |
|---|---|
| Company | Macaw |
| Title | (Semantic) Data Engineer (m/w/d) |
| Normalized title | - |
| Department / team | Service Line Data Solutions & Insights / GER - Vacancies |
| Location | Wuppertal |
| Work model | - |
| Employment type | Full Time |
| Salary | - |
| Status | active |
| ATS provider | Personio |
| Posted / first seen | 2026-05-19 / 2026-05-30 |
| Changed / last seen | 2026-05-30 / 2026-06-06 |
Related slices
| Page | What it contains | Open |
|---|---|---|
| Company jobs | Active postings from Macaw. | Open |
| Company breakdowns | Role, location, ATS, and work model facets for this company. | Open |
| ATS provider jobs | Active postings observed through Personio. | Open |
| Provider filtered search | The same provider as a filtered job collection. | Open |
| Department jobs | Active postings in Service Line Data Solutions & Insights. | Open |
| Lifecycle events | Open, update, close, and reopen events for this posting. | Open |
| Original posting | Canonical source or apply URL captured from the ATS. | Open |
Linked records
| Company | Macaw |
| Source | 7e208e74-157f-4971-b7f7-67f6bde78eca |
| ATS provider | Personio |
Description
Your mission
In dieser Rolle baust Du die Grundlage dafür, dass Unternehmenswissen aus unterschiedlichsten Quellen strukturiert, semantisch verknüpft und für AI Anwendungen nutzbar wird. In dieser Rolle arbeitest du an der Schnittstelle von Data Engineering, Knowledge Graphs und moderner AI Infrastruktur und gestaltest aktiv mit, wie aus komplexen Daten echte Intelligenz entsteht. Dabei bist du in einem Umfeld unterwegs, das viel Raum für Eigeninitiative bietet und in dem du neue Technologien und Ansätze kontinuierlich weiterentwickelst. Die Position entsteht im Zuge wachsender Projektanforderungen in einem stark projektgetriebenen Umfeld mit Fokus auf AI, moderne Datenplattformen und Enterprise Kunden.
Was dich bei uns erwartet:
Du arbeitest zusammen mit unseren Kunden an der Konzeption, dem Aufbau und der Wartung von Datenplattformen – von der Beschaffung der Daten aus der Quelle bis zur Bereitstellung für die Nutzer Du entwickelst und gestaltest zuverlässige, benutzerfreundliche Datenplattformen innerhalb eines Microsoft-Ökosystems und erstellst effiziente Datenpipelines mit Azure Data Factory, Azure Databricks und/oder Microsoft Fabric Du bist für die Erstellung leistungsfähiger Datenmodelle unter Verwendung von Python, SQL, PySpark oder SparkSQL verantwortlich (von dimensionaler Modellierung bis zur zweiten und dritten Normalform) Du baust und betreibst Preprocessing- und ETL-Pipelines für strukturierte und unstrukturierte Daten und stellst Datenqualität, Konsistenz und Nachvollziehbarkeit sicher Du analysierst bestehende Dokumentationen, Legacy-Systeme und Codebasen und bereitest diese für moderne Daten- und AI-Anwendungen strukturiert auf Du arbeitest mit Knowledge Graphs, Vector-Datenbanken und Embeddings zur Umsetzung semantischer Suche und AI Use Cases Du übernimmst die Verwaltung von Kunden-Umgebungen mit Azure DevOps und bist für Orchestrierung, Sicherheit und Bereitstellungspipelines zuständig
Your profile
Du hast einschlägige Berufserfahrung in einer ähnlichen Rolle im Bereich Data Engineering und kennst dich mit Azure Data Factory, Azure Foundry, Azure Synapse Analytics und/oder Azure Databricks aus Du bist begeistert von den neuesten Entwicklungen im Data & AI Bereich und experimentierst gerne mit neuen Technologien Du weißt große Datenmengen effizient zu verarbeiten und kennst dich mit Python, SQL, PySpark und SparkSQL aus Du hast Erfahrung mit Kundenberatung, Projektleitung und Stakeholdermanagement und arbeitest strukturiert und lösungsorientiert Du hast sehr starke Kommunikationsfähigkeiten in Deutsch und Englisch, um effektiv mit Teammitgliedern, Stakeholdern und Kunden zu interagieren Du hast idealerweise Erfahrung in der Verarbeitung und Strukturierung von Dokumenten sowie erste Berührungspunkte mit NLP, Knowledge Graphs oder Vector-Datenbanken Du bringst als Pluspunkt agile Arbeitserfahrung (z.B. Scrum), DevOps-Kenntnisse und Erfahrung mit Tools wie Azure Devops Boards oder JIRA mit
Full job record
| Job ID | 53236ed66eca2dd93e7b44b46945b67787a44b46 |
| Org ID | 381b1b78-0ccb-4044-88e9-9637fed2b211 |
| Source ID | 7e208e74-157f-4971-b7f7-67f6bde78eca |
| Board ID | 7e208e74-157f-4971-b7f7-67f6bde78eca |
| Provider | personio |
| Provider Job Key | 2639076 |
| Title | (Semantic) Data Engineer (m/w/d) |
| Normalized Title | — |
| Status | active |
| Active | yes |
| Location Text | Wuppertal |
| Department | Service Line Data Solutions & Insights |
| Team | GER - Vacancies |
| Employment Type | full_time |
| Workplace Type | — |
| Remote Policy | — |
| Country | Wuppertal |
| Region | — |
| City | — |
| Salary Raw | — |
| Salary Min | — |
| Salary Max | — |
| Salary Currency | — |
| Salary Period | — |
| Source URL | https://macaw.jobs.personio.de/job/2639076?language=en |
| Apply URL | https://macaw.jobs.personio.de/job/2639076?language=en |
| First Seen At | 2026-05-30 05:54:19Z |
| Last Seen At | 2026-06-06 07:57:47Z |
| Last Checked At | 2026-06-06 07:57:47Z |
| Last Changed At | 2026-05-30 05:54:19Z |
| Inactive At | — |
| Source Posted At | 2026-05-19 12:02:57Z |
| Source Updated At | — |
| Raw Payload Uri | s3://job-postings-prod-raw-590183727216/raw/provider=personio/board=macaw.de/date=2026-06-06/2026-06-06T07-57-46-625Z-fddacda435be40f0a529ae47d4059a54965881ffbe9364c3a141588ff1da4ce5.json |
Event Fields
{
"content_hash": "3eafd2f734c83a2a8a0f32b70c9b75b469dd5726f0acd2f7a9a5061a818a7253",
"source_hash": "9795f42db4d878ecad6fae7a8026e819701744c99dac876bb59027d07d90344b",
"last_changed_at": "2026-05-30T05:54:19.615Z",
"active_status": "active"
}Parsed Structured
{
"language": null,
"location": {
"raw": "Wuppertal",
"city": null,
"region": null,
"country": "Wuppertal",
"is_remote": false,
"confidence": 0.8
},
"salary_max": null,
"salary_min": null,
"inferred_at": "2026-06-06T07:57:47.313Z",
"launch_scope": {
"reason": "personio_production_catalog",
"included": true,
"location": {
"raw": "Wuppertal",
"city": null,
"region": null,
"country": "Wuppertal",
"is_remote": false,
"confidence": 0.8
},
"countries": [
"Wuppertal"
]
},
"remote_policy": null,
"salary_period": null,
"workplace_type": null,
"salary_currency": null
}Extensions
{}Native Structured
{
"id": "2639076",
"name": "(Semantic) Data Engineer (m/w/d)",
"office": "Wuppertal",
"keywords": [],
"schedule": "full-time",
"createdAt": "2026-05-19T12:02:57+00:00",
"seniority": "experienced",
"department": "Service Line Data Solutions & Insights",
"occupation": "database_development_and_administration",
"subcompany": "Macaw netzkern GmbH",
"employmentType": "permanent",
"jobDescriptions": [
{
"name": "Your mission",
"value": "In dieser Rolle baust Du die Grundlage dafür, dass Unternehmenswissen aus unterschiedlichsten Quellen strukturiert, semantisch verknüpft und für AI Anwendungen nutzbar wird. In dieser Rolle arbeitest du an der Schnittstelle von Data Engineering, Knowledge Graphs und moderner AI Infrastruktur und gestaltest aktiv mit, wie aus komplexen Daten echte Intelligenz entsteht. Dabei bist du in einem Umfeld unterwegs, das viel Raum für Eigeninitiative bietet und in dem du neue Technologien und Ansätze kontinuierlich weiterentwickelst. Die Position entsteht im Zuge wachsender Projektanforderungen in einem stark projektgetriebenen Umfeld mit Fokus auf AI, moderne Datenplattformen und Enterprise Kunden. <br><br><strong>Was dich bei uns erwartet:</strong><br><ul><li>Du arbeitest zusammen mit unseren Kunden an der Konzeption, dem Aufbau und der Wartung von Datenplattformen – von der Beschaffung der Daten aus der Quelle bis zur Bereitstellung für die Nutzer </li><li>Du entwickelst und gestaltest zuverlässige, benutzerfreundliche Datenplattformen innerhalb eines Microsoft-Ökosystems und erstellst effiziente Datenpipelines mit Azure Data Factory, Azure Databricks und/oder Microsoft Fabric </li><li>Du bist für die Erstellung leistungsfähiger Datenmodelle unter Verwendung von Python, SQL, PySpark oder SparkSQL verantwortlich (von dimensionaler Modellierung bis zur zweiten und dritten Normalform) </li><li>Du baust und betreibst Preprocessing- und ETL-Pipelines für strukturierte und unstrukturierte Daten und stellst Datenqualität, Konsistenz und Nachvollziehbarkeit sicher </li><li>Du analysierst bestehende Dokumentationen, Legacy-Systeme und Codebasen und bereitest diese für moderne Daten- und AI-Anwendungen strukturiert auf</li><li>Du arbeitest mit Knowledge Graphs, Vector-Datenbanken und Embeddings zur Umsetzung semantischer Suche und AI Use Cases </li><li>Du übernimmst die Verwaltung von Kunden-Umgebungen mit Azure DevOps und bist für Orchestrierung, Sicherheit und Bereitstellungspipelines zuständig </li></ul>"
},
{
"name": "Your profile",
"value": "<ul><li>Du hast einschlägige Berufserfahrung in einer ähnlichen Rolle im Bereich Data Engineering und kennst dich mit Azure Data Factory, Azure Foundry, Azure Synapse Analytics und/oder Azure Databricks aus </li><li>Du bist begeistert von den neuesten Entwicklungen im Data & AI Bereich und experimentierst gerne mit neuen Technologien </li><li>Du weißt große Datenmengen effizient zu verarbeiten und kennst dich mit Python, SQL, PySpark und SparkSQL aus</li><li>Du hast Erfahrung mit Kundenberatung, Projektleitung und Stakeholdermanagement und arbeitest strukturiert und lösungsorientiert</li><li>Du hast sehr starke Kommunikationsfähigkeiten in Deutsch und Englisch, um effektiv mit Teammitgliedern, Stakeholdern und Kunden zu interagieren</li><li>Du hast idealerweise Erfahrung in der Verarbeitung und Strukturierung von Dokumenten sowie erste Berührungspunkte mit NLP, Knowledge Graphs oder Vector-Datenbanken </li><li>Du bringst als Pluspunkt agile Arbeitserfahrung (z.B. Scrum), DevOps-Kenntnisse und Erfahrung mit Tools wie Azure Devops Boards oder JIRA mit </li></ul>"
}
],
"occupationCategory": "it_software",
"recruitingCategory": "GER - Vacancies"
}Get this page with API
Rendered from the bluedoor Job Postings API. Reproduce it:
GET https://api.bluedoor.sh/job-postings/v1/jobs/53236ed66eca2dd93e7b44b46945b67787a44b46?include=descriptionJSONGET https://api.bluedoor.sh/job-postings/v1/orgs/381b1b78-0ccb-4044-88e9-9637fed2b211JSONGET https://api.bluedoor.sh/job-postings/v1/sources/7e208e74-157f-4971-b7f7-67f6bde78ecaJSONGET https://api.bluedoor.sh/job-postings/v1/jobs/53236ed66eca2dd93e7b44b46945b67787a44b46/eventsJSON