GRID_STYLE
TRUE

Classic Header

{fbt_classic_header}

ΠΗΓΗ Α.Ε

ΤΙΤΛΟΙ ΕΙΔΗΣΕΩΝ:

latest

ISTIKBAL


Εφορία: Με τεχνητή νοημοσύνη ξετρυπώνει τη φοροδιαφυγή -Τι είναι το data mining ή αλλιώς «εξόρυξη δεδομένων»

Αποκάλυψη φοροφυγάδων με… data mining. 


Αποκάλυψη φοροφυγάδων με… data mining. 

Τι είναι, όμως, η «εξόρυξη δεδομένων»; Σε τι χρησιμεύει. Στην προκειμένη περίπτωση; Η Εφορία με τεχνητή νοημοσύνη ξετρυπώνει τους φοροφυγάδες…

Βαριές καμπάνες μάλιστα αναμένονται σε όσους κρύβουν πισίνες.

Όσο για το τι ακριβώς κάνει, σε γενικότερη μορφή;

«Εξόρυξη δεδομένων», λοιπόν, είναι η εξεύρεση μιας πληροφορίας ή προτύπων από μεγάλες βάσεις δεδομένων, με χρήση αλγορίθμων ομαδοποίησης ή κατηγοριοποίησης και των αρχών της στατιστικής, της τεχνητής νοημοσύνης, της μηχανικής μάθησης και των συστημάτων βάσεων δεδομένων.

Σύμφωνα με το ρεπορτάζ του Open, τη διαδικασία αναζήτησης φοροφυγάδων την ξεκίνησε η Γαλλία!

Τι είναι η «εξόρυξη δεδομένων»

Η «εξόρυξη δεδομένων» είναι ουσιαστικά η διαδικασία ταξινόμησης, μέσω μεγάλων συνόλων δεδομένων, για τον εντοπισμό προτύπων και σχέσεων, που μπορούν να βοηθήσουν στην επίλυση επιχειρηματικών προβλημάτων μέσω της ανάλυσης δεδομένων.

Οι τεχνικές και τα εργαλεία εξόρυξης δεδομένων επιτρέπουν στις επιχειρήσεις να προβλέπουν τις μελλοντικές τάσεις και να λαμβάνουν πιο ενημερωμένες επιχειρηματικές αποφάσεις.

Η «εξόρυξη δεδομένων» είναι επίσης ένα βασικό μέρος της ανάλυσης δεδομένων συνολικά και ένας από τους βασικούς κλάδους της επιστήμης δεδομένων, η οποία χρησιμοποιεί προηγμένες τεχνικές ανάλυσης για να βρει χρήσιμες πληροφορίες σε σύνολα δεδομένων.

Σε πιο αναλυτικό επίπεδο, είναι ένα βήμα στη διαδικασία ανακάλυψης γνώσης σε βάσεις δεδομένων (KDD), μια μεθοδολογία επιστήμης δεδομένων για τη συλλογή, την επεξεργασία και την ανάλυση δεδομένων.

Η εξόρυξη δεδομένων, αλλά και το KDD αναφέρονται μερικές φορές εναλλακτικά, αλλά συνήθως θεωρούνται διαφορετικά πράγματα.

Γιατί είναι σημαντική

Πρόκειται για κρίσιμο συστατικό των επιτυχημένων πρωτοβουλιών ανάλυσης σε οργανισμούς.

Οι πληροφορίες, που δημιουργεί, μπορούν να χρησιμοποιηθούν σε εφαρμογές επιχειρηματικής ευφυΐας (BI) και προηγμένων αναλυτικών εφαρμογών, που περιλαμβάνουν ανάλυση ιστορικών δεδομένων, καθώς και σε εφαρμογές ανάλυσης σε πραγματικό χρόνο που εξετάζουν δεδομένα ροής καθώς δημιουργούνται ή συλλέγονται.

Η αποτελεσματική εξόρυξη δεδομένων βοηθά σε διάφορες πτυχές του σχεδιασμού επιχειρηματικών στρατηγικών και της διαχείρισης των λειτουργιών.

Αυτό περιλαμβάνει λειτουργίες, που αφορούν τους πελάτες, όπως το μάρκετινγκ, τη διαφήμιση, τις πωλήσεις και την υποστήριξη πελατών, καθώς και την κατασκευή, τη διαχείριση της εφοδιαστικής αλυσίδας, τη χρηματοδότηση και το ανθρώπινο δυναμικό.

Η εξόρυξη δεδομένων υποστηρίζει τον εντοπισμό απάτης, τη διαχείριση κινδύνου, τον σχεδιασμό κυβερνοασφάλειας και πολλές άλλες κρίσιμες περιπτώσεις επιχειρηματικής χρήσης.

Διαδραματίζει επίσης σημαντικό ρόλο στην υγειονομική περίθαλψη, την κυβέρνηση, την επιστημονική έρευνα, τα μαθηματικά, τον αθλητισμό και πολλά άλλα.


Τα βασικά στοιχεία

Γίνεται συνήθως από επιστήμονες δεδομένων και άλλους ειδικευμένους επαγγελματίες του BI και της ανάλυσης. Αλλά μπορεί επίσης να εκτελεστεί από επιχειρησιακούς αναλυτές, στελέχη και εργαζόμενους με γνώσεις δεδομένων, που λειτουργούν ως επιστήμονες δεδομένων πολιτών σε έναν οργανισμό.

Τα βασικά του στοιχεία περιλαμβάνουν τη μηχανική μάθηση και τη στατιστική ανάλυση, μαζί με εργασίες διαχείρισης δεδομένων που γίνονται για την προετοιμασία δεδομένων για ανάλυση.

Η χρήση αλγορίθμων μηχανικής μάθησης και εργαλείων τεχνητής νοημοσύνης (AI) έχει αυτοματοποιήσει περισσότερο τη διαδικασία και διευκόλυνε την εξόρυξη τεράστιων συνόλων δεδομένων, όπως βάσεις δεδομένων πελατών, αρχεία συναλλαγών και αρχεία καταγραφής από διακομιστές ιστού, εφαρμογές για κινητά και αισθητήρες.

Η διαδικασία εξόρυξης δεδομένων μπορεί να αναλυθεί σε αυτά τα τέσσερα κύρια στάδια:

  • Συλλογή πληροφοριών. Εντοπίζονται και συγκεντρώνονται σχετικά δεδομένα για μια εφαρμογή αναλυτικών στοιχείων. Τα δεδομένα μπορεί να βρίσκονται σε διαφορετικά συστήματα πηγής, μια αποθήκη δεδομένων ή μια λίμνη δεδομένων, μια ολοένα και πιο κοινή αποθήκη σε περιβάλλοντα μεγάλων δεδομένων που περιέχουν ένα μείγμα δομημένων και μη δομημένων δεδομένων. Μπορούν επίσης να χρησιμοποιηθούν εξωτερικές πηγές δεδομένων. Από όπου κι αν προέρχονται τα δεδομένα, ένας επιστήμονας δεδομένων τα μετακινεί συχνά σε μια λίμνη δεδομένων για τα υπόλοιπα βήματα της διαδικασίας.
  • Προετοιμασία δεδομένων. Αυτό το στάδιο περιλαμβάνει ένα σύνολο βημάτων για την προετοιμασία των δεδομένων για εξόρυξη. Ξεκινά με την εξερεύνηση δεδομένων, τη δημιουργία προφίλ και την προεπεξεργασία, ακολουθούμενη από εργασίες καθαρισμού δεδομένων για τη διόρθωση σφαλμάτων και άλλων προβλημάτων ποιότητας δεδομένων. Ο μετασχηματισμός δεδομένων γίνεται επίσης για να γίνουν τα σύνολα δεδομένων συνεπή, εκτός εάν ένας επιστήμονας δεδομένων θέλει να αναλύσει αφιλτράριστα ακατέργαστα δεδομένα για μια συγκεκριμένη εφαρμογή.
  • Εξόρυξη δεδομένων. Μόλις προετοιμαστούν τα δεδομένα, ένας επιστήμονας δεδομένων επιλέγει την κατάλληλη τεχνική εξόρυξης δεδομένων και στη συνέχεια εφαρμόζει έναν ή περισσότερους αλγόριθμους για να κάνει την εξόρυξη. Σε εφαρμογές μηχανικής εκμάθησης, οι αλγόριθμοι πρέπει συνήθως να εκπαιδεύονται σε δείγματα συνόλων δεδομένων για να αναζητήσουν τις πληροφορίες που αναζητούνται προτού εκτελεστούν με το πλήρες σύνολο δεδομένων.
  • Ανάλυση και ερμηνεία δεδομένων. Τα αποτελέσματα της εξόρυξης δεδομένων χρησιμοποιούνται για τη δημιουργία αναλυτικών μοντέλων που μπορούν να βοηθήσουν στη λήψη αποφάσεων και σε άλλες επιχειρηματικές ενέργειες. Ο επιστήμονας δεδομένων ή άλλο μέλος μιας ομάδας επιστήμης δεδομένων πρέπει επίσης να κοινοποιεί τα ευρήματα σε στελέχη επιχειρήσεων και χρήστες, συχνά μέσω οπτικοποίησης δεδομένων και χρήσης τεχνικών αφήγησης δεδομένων.

Δεν υπάρχουν σχόλια