Data Engineer

c5i

Bengaluru, India

Fresher

Save

Posted 3 hours ago
Be among the first 10 applicants

Early Applicant

Job Description

We are looking for a skilled Data Engineer with strong expertise in Python, PySpark and Scala to build and manage scalable data pipelines and support data processing across large datasets.

Key Responsibilities:

Design, develop, and maintain scalable data pipelines using PySpark
Work with Hadoop ecosystem for distributed data processing and storage
Develop and optimize Python-based data workflows
Schedule, monitor, and manage workflows using Airflow
Collaborate with cross-functional teams to ensure data availability and reliability

Must-have Skills:

Strong hands-on experience with PySpark
Good knowledge of Hadoop ecosystem (HDFS, Hive, etc.)
Proficiency in Python programming
Experience with Apache Airflow for workflow orchestration
Understanding of data processing, ETL concepts, and large-scale data systems

More Info

Job Type:

Industry:

Function:

Employment Type:

About Company

c5iJob Source: www.linkedin.com

Job ID: 147487491

Jobs by Skill - IT

Jobs by Skill - Non IT

International Jobs

Last Updated: 15-05-2026 10:15:33 PM

Homejobs in Bengaluru / BangaloreData Engineer

Similar Jobs

Data Engineer I

Honeywell

Bengaluru, India

Skills:

Machine Learning, Python, Data Analysis, R, Statistical Modeling

Data Engineer -Microsoft Fabric(SJ-IQ)

SE-Mentor Solutions (P) Ltd

Bengaluru, India

Skills:

Power Bi, Power Automate, Pyspark, Data Warehousing, Sql, Pandas, Dax, Python, ETL ELT processes, Power Apps, Delta tables, Lakehouse architecture, Microsoft Fabric, Medallion architecture

Lead AWS Data Engineer

LSEG

Bengaluru, India

Skills:

Pytest, Apache Spark, Python, Apache Iceberg, data engineering basics, ETL pipelines

Data Engineer SDE III

Jhana

Bengaluru, India

Skills:

Elasticsearch, Django, Api Development, Restful Services, Sql, Python, FAISS, vector databases, Milvus, search stacks agents

Pyspark, Scala, Azure Databricks, Api Integration, Dimensional Modeling, Sql, ELT, Git, Query Tuning, Azure Synapse Analytics, Spark, Star Schema, Python, Azure DevOps, Etl, Snowflake schema, Databricks jobs, Azure SQL Database, GitHub Actions, Caching strategies, Partitioning, Delta Lake, ADF pipelines