Home › Companies › Macaw › (Semantic) Data Engineer (m/w/d)

(Semantic) Data Engineer (m/w/d)

Macaw · Wuppertal · Active · Personio

Job facts

Field	Value
Company	Macaw
Title	(Semantic) Data Engineer (m/w/d)
Normalized title	-
Department / team	Service Line Data Solutions & Insights / GER - Vacancies
Location	Wuppertal
Work model	-
Employment type	Full Time
Salary	-
Status	active
ATS provider	Personio
Posted / first seen	2026-05-19 / 2026-05-30
Changed / last seen	2026-05-30 / 2026-06-06

Related slices

Page	What it contains	Open
Company jobs	Active postings from Macaw.	Open
Company breakdowns	Role, location, ATS, and work model facets for this company.	Open
ATS provider jobs	Active postings observed through Personio.	Open
Provider filtered search	The same provider as a filtered job collection.	Open
Department jobs	Active postings in Service Line Data Solutions & Insights.	Open
Lifecycle events	Open, update, close, and reopen events for this posting.	Open
Original posting	Canonical source or apply URL captured from the ATS.	Open

Linked records

Company	Macaw
Source	7e208e74-157f-4971-b7f7-67f6bde78eca
ATS provider	Personio

Description

Your mission In dieser Rolle baust Du die Grundlage dafür, dass Unternehmenswissen aus unterschiedlichsten Quellen strukturiert, semantisch verknüpft und für AI Anwendungen nutzbar wird. In dieser Rolle arbeitest du an der Schnittstelle von Data Engineering, Knowledge Graphs und moderner AI Infrastruktur und gestaltest aktiv mit, wie aus komplexen Daten echte Intelligenz entsteht. Dabei bist du in einem Umfeld unterwegs, das viel Raum für Eigeninitiative bietet und in dem du neue Technologien und Ansätze kontinuierlich weiterentwickelst. Die Position entsteht im Zuge wachsender Projektanforderungen in einem stark projektgetriebenen Umfeld mit Fokus auf AI, moderne Datenplattformen und Enterprise Kunden. Was dich bei uns erwartet: Du arbeitest zusammen mit unseren Kunden an der Konzeption, dem Aufbau und der Wartung von Datenplattformen – von der Beschaffung der Daten aus der Quelle bis zur Bereitstellung für die Nutzer Du entwickelst und gestaltest zuverlässige, benutzerfreundliche Datenplattformen innerhalb eines Microsoft-Ökosystems und erstellst effiziente Datenpipelines mit Azure Data Factory, Azure Databricks und/oder Microsoft Fabric Du bist für die Erstellung leistungsfähiger Datenmodelle unter Verwendung von Python, SQL, PySpark oder SparkSQL verantwortlich (von dimensionaler Modellierung bis zur zweiten und dritten Normalform) Du baust und betreibst Preprocessing- und ETL-Pipelines für strukturierte und unstrukturierte Daten und stellst Datenqualität, Konsistenz und Nachvollziehbarkeit sicher Du analysierst bestehende Dokumentationen, Legacy-Systeme und Codebasen und bereitest diese für moderne Daten- und AI-Anwendungen strukturiert auf Du arbeitest mit Knowledge Graphs, Vector-Datenbanken und Embeddings zur Umsetzung semantischer Suche und AI Use Cases Du übernimmst die Verwaltung von Kunden-Umgebungen mit Azure DevOps und bist für Orchestrierung, Sicherheit und Bereitstellungspipelines zuständig Your profile Du hast einschlägige Berufserfahrung in einer ähnlichen Rolle im Bereich Data Engineering und kennst dich mit Azure Data Factory, Azure Foundry, Azure Synapse Analytics und/oder Azure Databricks aus Du bist begeistert von den neuesten Entwicklungen im Data & AI Bereich und experimentierst gerne mit neuen Technologien Du weißt große Datenmengen effizient zu verarbeiten und kennst dich mit Python, SQL, PySpark und SparkSQL aus Du hast Erfahrung mit Kundenberatung, Projektleitung und Stakeholdermanagement und arbeitest strukturiert und lösungsorientiert Du hast sehr starke Kommunikationsfähigkeiten in Deutsch und Englisch, um effektiv mit Teammitgliedern, Stakeholdern und Kunden zu interagieren Du hast idealerweise Erfahrung in der Verarbeitung und Strukturierung von Dokumenten sowie erste Berührungspunkte mit NLP, Knowledge Graphs oder Vector-Datenbanken Du bringst als Pluspunkt agile Arbeitserfahrung (z.B. Scrum), DevOps-Kenntnisse und Erfahrung mit Tools wie Azure Devops Boards oder JIRA mit

Full job record

Job ID	53236ed66eca2dd93e7b44b46945b67787a44b46
Org ID	381b1b78-0ccb-4044-88e9-9637fed2b211
Source ID	7e208e74-157f-4971-b7f7-67f6bde78eca
Board ID	7e208e74-157f-4971-b7f7-67f6bde78eca
Provider	personio
Provider Job Key	2639076
Title	(Semantic) Data Engineer (m/w/d)
Normalized Title	—
Status	active
Active	yes
Location Text	Wuppertal
Department	Service Line Data Solutions & Insights
Team	GER - Vacancies
Employment Type	full_time
Workplace Type	—
Remote Policy	—
Country	Wuppertal
Region	—
City	—
Salary Raw	—
Salary Min	—
Salary Max	—
Salary Currency	—
Salary Period	—
Source URL	https://macaw.jobs.personio.de/job/2639076?language=en
Apply URL	https://macaw.jobs.personio.de/job/2639076?language=en
First Seen At	2026-05-30 05:54:19Z
Last Seen At	2026-06-06 07:57:47Z
Last Checked At	2026-06-06 07:57:47Z
Last Changed At	2026-05-30 05:54:19Z
Inactive At	—
Source Posted At	2026-05-19 12:02:57Z
Source Updated At	—
Raw Payload Uri	s3://job-postings-prod-raw-590183727216/raw/provider=personio/board=macaw.de/date=2026-06-06/2026-06-06T07-57-46-625Z-fddacda435be40f0a529ae47d4059a54965881ffbe9364c3a141588ff1da4ce5.json

Event Fields

{
  "content_hash": "3eafd2f734c83a2a8a0f32b70c9b75b469dd5726f0acd2f7a9a5061a818a7253",
  "source_hash": "9795f42db4d878ecad6fae7a8026e819701744c99dac876bb59027d07d90344b",
  "last_changed_at": "2026-05-30T05:54:19.615Z",
  "active_status": "active"
}

Parsed Structured

{
  "language": null,
  "location": {
    "raw": "Wuppertal",
    "city": null,
    "region": null,
    "country": "Wuppertal",
    "is_remote": false,
    "confidence": 0.8
  },
  "salary_max": null,
  "salary_min": null,
  "inferred_at": "2026-06-06T07:57:47.313Z",
  "launch_scope": {
    "reason": "personio_production_catalog",
    "included": true,
    "location": {
      "raw": "Wuppertal",
      "city": null,
      "region": null,
      "country": "Wuppertal",
      "is_remote": false,
      "confidence": 0.8
    },
    "countries": [
      "Wuppertal"
    ]
  },
  "remote_policy": null,
  "salary_period": null,
  "workplace_type": null,
  "salary_currency": null
}

Extensions

{}

Native Structured

{
  "id": "2639076",
  "name": "(Semantic) Data Engineer (m/w/d)",
  "office": "Wuppertal",
  "keywords": [],
  "schedule": "full-time",
  "createdAt": "2026-05-19T12:02:57+00:00",
  "seniority": "experienced",
  "department": "Service Line Data Solutions & Insights",
  "occupation": "database_development_and_administration",
  "subcompany": "Macaw netzkern GmbH",
  "employmentType": "permanent",
  "jobDescriptions": [
    {
      "name": "Your mission",
      "value": "In dieser Rolle baust Du die Grundlage dafür, dass Unternehmenswissen aus unterschiedlichsten Quellen strukturiert, semantisch verknüpft und für AI Anwendungen nutzbar wird. In dieser Rolle arbeitest du an der Schnittstelle von Data Engineering, Knowledge Graphs und moderner AI Infrastruktur und gestaltest aktiv mit, wie aus komplexen Daten echte Intelligenz entsteht. Dabei bist du in einem Umfeld unterwegs, das viel Raum für Eigeninitiative bietet und in dem du neue Technologien und Ansätze kontinuierlich weiterentwickelst. Die Position entsteht im Zuge wachsender Projektanforderungen in einem stark projektgetriebenen Umfeld mit Fokus auf AI, moderne Datenplattformen und Enterprise Kunden. <br><br><strong>Was dich bei uns erwartet:</strong><br><ul><li>Du arbeitest zusammen mit unseren Kunden an der Konzeption, dem Aufbau und der Wartung von Datenplattformen – von der Beschaffung der Daten aus der Quelle bis zur Bereitstellung für die Nutzer </li><li>Du entwickelst und gestaltest zuverlässige, benutzerfreundliche Datenplattformen innerhalb eines Microsoft-Ökosystems und erstellst effiziente Datenpipelines mit Azure Data Factory, Azure Databricks und/oder Microsoft Fabric </li><li>Du bist für die Erstellung leistungsfähiger Datenmodelle unter Verwendung von Python, SQL, PySpark oder SparkSQL verantwortlich (von dimensionaler Modellierung bis zur zweiten und dritten Normalform) </li><li>Du baust und betreibst Preprocessing- und ETL-Pipelines für strukturierte und unstrukturierte Daten und stellst Datenqualität, Konsistenz und Nachvollziehbarkeit sicher </li><li>Du analysierst bestehende Dokumentationen, Legacy-Systeme und Codebasen und bereitest diese für moderne Daten- und AI-Anwendungen strukturiert auf</li><li>Du arbeitest mit Knowledge Graphs, Vector-Datenbanken und Embeddings zur Umsetzung semantischer Suche und AI Use Cases </li><li>Du übernimmst die Verwaltung von Kunden-Umgebungen mit Azure DevOps und bist für Orchestrierung, Sicherheit und Bereitstellungspipelines zuständig </li></ul>"
    },
    {
      "name": "Your profile",
      "value": "<ul><li>Du hast einschlägige Berufserfahrung in einer ähnlichen Rolle im Bereich Data Engineering und kennst dich mit Azure Data Factory, Azure Foundry, Azure Synapse Analytics und/oder Azure Databricks aus  </li><li>Du bist begeistert von den neuesten Entwicklungen im Data & AI Bereich und experimentierst gerne mit neuen Technologien </li><li>Du weißt große Datenmengen effizient zu verarbeiten und kennst dich mit Python, SQL, PySpark und SparkSQL aus</li><li>Du hast Erfahrung mit Kundenberatung, Projektleitung und Stakeholdermanagement und arbeitest strukturiert und lösungsorientiert</li><li>Du hast sehr starke Kommunikationsfähigkeiten in Deutsch und Englisch, um effektiv mit Teammitgliedern, Stakeholdern und Kunden zu interagieren</li><li>Du hast idealerweise Erfahrung in der Verarbeitung und Strukturierung von Dokumenten sowie erste Berührungspunkte mit NLP, Knowledge Graphs oder Vector-Datenbanken </li><li>Du bringst als Pluspunkt agile Arbeitserfahrung (z.B. Scrum), DevOps-Kenntnisse und Erfahrung mit Tools wie Azure Devops Boards oder JIRA mit </li></ul>"
    }
  ],
  "occupationCategory": "it_software",
  "recruitingCategory": "GER - Vacancies"
}

Get this page with API

Rendered from the bluedoor Job Postings API. Reproduce it:

GET https://api.bluedoor.sh/job-postings/v1/jobs/53236ed66eca2dd93e7b44b46945b67787a44b46?include=descriptionJSON

GET https://api.bluedoor.sh/job-postings/v1/orgs/381b1b78-0ccb-4044-88e9-9637fed2b211JSON

GET https://api.bluedoor.sh/job-postings/v1/sources/7e208e74-157f-4971-b7f7-67f6bde78ecaJSON

GET https://api.bluedoor.sh/job-postings/v1/jobs/53236ed66eca2dd93e7b44b46945b67787a44b46/eventsJSON

Docs · Get an API key