Im Folgenden finden Sie eine Aufstellung der zur Verfügung stehenden Themen. Die angegebene Literatur versteht sich als Startlektüre und weitere Literatur sollte selbstständig recherchiert wertden.

Themenblock 1: Data Infrastruktur

  1. Verteilte Dateisysteme
    • Jeffrey Dean and Sanjay Ghemawat. MapReduce: Simplified Data Processing on Large Clusters. In OSDI'04: Proceedings of the 6th conference on Symposium on Operating Systems Design & Implementation, pages 137-150, Berkeley, CA, USA, 2004. USENIX Association.
    • Sanjay Ghemawat, Howard Gobioff, and Shun-Tak Leung. The Google File System. SIGOPS Oper. Syst. Rev., 37(5):29, 2003.
    • Hadoop File System. http://hadoop.apache.org/common/docs/current/hdfs_design.html
  2. Cluster Scheduling
  3. Distributed Processing Engines
  4. SQL Engines
  5. Stream Processing
  6. Cloud-Services for Data

Themenblock 2: Data Science und Machine Learning

  1. Data Science Overview: Methods and Frameworks
  2. Machine Learning Best Practices
  3. Distributed Machine Learning
  4. Model Deployment

Themenblock 3: Deep Learning

  1. Deep Learning: Convolutional Neural Networks
  2. Deep Learning Frameworks: Caffe, Torch/PyTorch, Tensorflow, CNTK, MXNet

Last Change: Mon, 11 Dec 2023 07:35:29 +0100 - Viewed on: Fri, 01 Nov 2024 09:25:41 +0100
Copyright © MNM-Team http://www.mnm-team.org - Impressum / Legal Info  - Datenschutz / Privacy