Data Engineering – C4: Container, Code, Cloud & Context

EF Core 10: Vector Search, LeftJoin/RightJoin, and Full-Text Search on Cosmos DB

Posted on January 23, 2026 by Nithin Mohan TK 8 min read

Entity Framework Core 10, released alongside .NET 10, introduces features that position it as a first-class choice for AI-powered applications. The headline addition—vector search support—enables semantic similarity queries directly in LINQ, while new LeftJoin/RightJoin operators and Cosmos DB full-text search round out a release focused on modern data access patterns. This comprehensive guide explores each […]

Data Quality for AI: Ensuring High-Quality Training Data

Posted on December 5, 2025 by Nithin Mohan TK 13 min read

Data quality determines AI model performance. After managing data quality for 100+ AI projects, I’ve learned what matters. Here’s the complete guide to ensuring high-quality training data. Figure 1: Data Quality Framework Why Data Quality Matters Data quality directly impacts model performance: Accuracy: Poor data leads to poor predictions Bias: Biased data creates biased models […]

Real-Time Data Streaming with Apache Kafka: Building Production Event Pipelines in Python

Posted on November 26, 2025 by Nithin Mohan TK 12 min read

Introduction: Real-time data streaming has become essential for modern data architectures, enabling immediate insights and actions on data as it arrives. This comprehensive guide explores production streaming patterns using Apache Kafka and Python, covering producer/consumer design, stream processing with Flink, exactly-once semantics, and operational best practices. After building streaming platforms processing billions of events daily, […]

Searching in

Category: Data Engineering

EF Core 10: Vector Search, LeftJoin/RightJoin, and Full-Text Search on Cosmos DB

Data Quality for AI: Ensuring High-Quality Training Data

Real-Time Data Streaming with Apache Kafka: Building Production Event Pipelines in Python