CODCENTRIC.AI BOOTCAMP

Multivariate Linear Regression

Inhalt

  • Was ist Natural Language Processing?
  • Was kann NLP?
  • Was kann NLP nicht (so gut)?
  • Welche Verfahren nutzt NLP?
  • ...

Was ist NLP?

Was kann NLP?

Was kann NLP nicht (so gut)?

  • Mehrdeutigkeit (Homonym)

"Konstanz?"

  • Stadt am Bodensee?
  • Synonym für "Beständigkeit"?

Was kann NLP nicht (so gut)?

  • Mehrdeutigkeit (Homonym)
  • Fehlendes Kontextwissen/Weltwissen

"Michael Jackson war bei den Ereignissen des Blutsonntag anwesend."

Was kann NLP nicht (so gut)?

  • Mehrdeutigkeit (Homonym)
  • Fehlendes Kontextwissen/Weltwissen
  • Referenzen

"Die Diebe haben mehrere Kunstgegenstände geraubt."

  • Sie wurden kurze Zeit später fest genommen.
  • Sie wurden kurze Zeit später verkauft.
  • Sie wurden kurze Zeit später gefunden.

Was kann NLP nicht (so gut)?

  • Mehrdeutigkeit (Homonym)
  • Fehlendes Kontextwissen/Weltwissen
  • Referenzen
  • Slang / Umgangssprache / Veränderungen in der Bedeutung von Worten

"Sie ist toll!"

  • ungewöhnlich, unglaublich
  • [...]
  • (veraltet) tollwütig
  • (veraltet) sich aufgrund einer Psychose auffällig benehmend

Welche NLP Techniken gibt es?

Tutorial

Tokenizer

  • Teil der Vorverarbeitung
  • zerlegt Text in Token, meistens einzelne Wörter
  • Probleme: Umgang mit
    • Punktuation: "Hr. Meier" -> Hr. | Meier
    • Emoticons: Wie erkennen?
    • Namen, die aus 2 Wörtern bestehen: zusammen lassen oder nicht?

Stop Word (Stoppwort)

  • Bullet One
  • Bullet Two
  • Bullet Three

Multivariate Linear Regression

By cc_ai

Multivariate Linear Regression

Intro MVA

  • 83
Loading comments...

More from cc_ai