как да станете анализатор на данни без опит


Отговор 1:

Да, можете да станете учен за данни без предишен опит.

Изберете един домейн, с който искате да работите, и се опитайте да приложите обучението си в този домейн. Бъдете информирани за текущите тенденции в тези домейни и създавайте POC (Proof of Concept).

> Застраховане

> Банки и финанси

> Маркетинг

> Анализ на клиенти или HR

> Пътуване и др.

Следвам този подход.

Стъпка 1. Изберете език за програмиране (Python, R)

>

Научете Python за структури от данни, алгоритми и интервюта

>

Наука за данни и машинно обучение Bootcamp с R

>

Уроци за програмиране на Python

Изберете програмиране, което ви подхожда най-много. Python и R имат плюсове и минуси. Python е по-популярен поради поддръжката и библиотеките.

Стъпка 2. Научете статистика

>

Статистика за наука за данни и бизнес анализ

>

Статистика и наука за данните

> Въведение в статистическото обучение: с приложения в R

>

Статистика и наука за данните

> ken black business statistics (книга).

Най-важното нещо, с което да започнете научно пътешествие с данни. Трябва да разберете основните статистически данни, тогава само вие можете да приложите модел, да интерпретирате резултата и да настроите модела.

Стъпка 3. Извличане на данни

>

Регресия, извличане на данни, извличане на текст, прогнозиране с помощта на R

> извличане на данни: концепции и техники от han, kamber и pei

Най-недооцененото, но най-важното нещо, за да стартирате Data Science.

Стъпки 4. Линейна алгебра

>

Видео лекции | Линейна алгебра | Математика | MIT OpenCourseWare

>

Основна линейна алгебра: от теория до изпълнение

Линейната алгебра е най-важно да се научи, за да можете да формирате данните според модела, векторизацията и т.н.

Стъпка 5. Визуализация и анализ на данни

> Наука за данни AZ ™: Включени са упражнения за наука в реалния живот.

>

Уроци за програмиране на Python

>

Уроци за програмиране на Python

> Панди за обучение (Packt-Book)

можете да правите проучвателен анализ на данни, да намирате тенденции и т.н. Pandas, Matplotlib, Seaborn и др. са някои богати библиотеки за анализ и визуализация на данни.

Стъпка 6. Машинно обучение

> Машинно обучение AZ ™: практически Python & R в науката за данни.

> Овладяване на машинно обучение с Sci-kit Learn (Packt-Book).

>

Уроци за програмиране на Python

>

Машинно обучение | Coursera

Можете да започнете с Scikit learn и да започнете с основни udemy курсове. Хората препоръчват курса на Andrew NG, но е много трудно да се следва за начало и много малко са в състояние да го завършат. Курсовете на Jose Portilla са лесни за разбиране и изпълнение.

Стъпка 7. Естествено обучение

>

NLP - Обработка на естествен език с Python

>

Наука за данни: Обработка на естествен език (NLP) в Python

>

Обработка на естествен език с дълбоко обучение в Python

НЛП е лесен, но много труден. Следвах първия курс в списъка. Той е изчерпателен и ми даде достатъчно сцепление с темата.

Стъпка 8. Прогнозиране на времеви редове.

>

Python за анализ на данни от времеви редове

>

Въведение в анализ на времевите редове и прогнозиране в R

Стъпка 9: Дълбоко обучение и изкуствено

> Дълбоко обучение AZ ™: практически изкуствени невронни мрежи.

>

Невронни мрежи и задълбочено обучение | Coursera.

>

Total TensorFlow: Дълбоко обучение с Python

можете да научите задълбочено обучение с помощта на поток Keras или Tensor. Уча се с помощта на Keras, тъй като е доста лесно в сравнение с Tensorflow.

Стъпка 10: Конкуренция, блогове.

> kaggle

> Анализ Видя.

> R блогъри, средни, Към науката за данните.

> Github

Предпочитам да преминавам през книги и курсове, които са лесни и не изискват много математика. Не съм голям фен на Coursera, тъй като изисква много време, както и основната математика. Не казвам, че никога няма да премина през тях, по-скоро като начинаещ предпочитам да започна нещо, което мога да схвана и тъй като нивото ми ще се увеличи, ще прегледам и тези курсове.


Отговор 2:

Да, можеш. Но трябва да сте от математически / статистически произход. Ако сте харесали математика / статистика във вашето училище като предмет, можете да станете учен по данни.

Има 6 основни умения, които ученият по данни трябва да притежава:

1.) Статистика: Тя е сърцевината на науката за данните, всички алгоритми за анализ на данни използват статистически принципи за анализ на данните. Събирането, анализът, интерпретацията, представянето и организацията на данните е един от най-важните аспекти на Data Science.

2.) Езици за програмиране: Езиците за програмиране помагат на изследователите на данни да проектират инструменти за анализ на данни. Python и R са два езика за програмиране, които специалистите по данни използват широко. Така че, ако не сте запознати с езиците за програмиране, ще трябва да положите още усилия, за да научите един от тези два езика.

3.) Технологии за големи данни: Очевидно трябва да имате известна представа за технологиите за големи данни, за да използвате големи данни. Hadoop и Spark са много използвани. Така че, трябва да знаете как да използвате тези технологии.

4.) Инструменти за визуализация на данни: Важна задача за учения за данни е да съобщи на различна аудитория какво показват статистическите данни и какви данни разкриват. Инструментите за визуализация на данни помагат на учените по данни да направят това привлекателно и ефективно. Разбирането на инструменти като Tableau, QlikView и Power BI на Microsoft подобрява способността на учения за данни да обяснява ключови констатации просто.

5.) Алгоритми за машинно обучение: Както подсказва името му, той се отнася до способността на компютъра да се учи от набор от данни и да се адаптира, без изрично да е програмиран да го прави. Машинното обучение използва алгоритми за анализ на входни данни и прогнозиране на изход в приемлив диапазон.

6.) Бизнес проницателност: Бизнес проницателността е ключов компонент на науката за данните, тъй като осигурява контекста за всички усилия на науката за данни. Без разбиране как функционират бизнесите - и по-конкретно - домейните, ученият по данни няма да знае как да генерира ключови прозрения или какво да прави с тях. Ученият за данни трябва да има желание да се учи от ключови заинтересовани страни и постоянно да се стреми да подобри разбирането си за маркетинг, операции, комуникации.

Ако не сте запознати с Data Science, програмата DataTrained Data Science е най-подходяща за вас. Следват процесите, които следваме, за да осигурим 100% пласиране.

  • Първо, ние провеждаме онлайн тестове за оценка, така че само висококачествени студенти да бъдат въведени в програмата, което прави нашата програма силно конкурентна. Само 1 от 20 кандидати средно се класират за програмата.
  • Всеки човек е назначен за наставник експерт по наука за данни.
  • Заедно с теорията, по-голям акцент е върху практическото и интерактивно обучение по проекти на живо в индустрията.
  • Индивидуален профил на кариерата е изготвен от нашите експерти, така че да отговаря на предишния му опит и да го направи подходящ за ролята на Data Scientist.
  • Наставникът на индустрията помага на студентите да вземат проекти за Kaggle и да се придвижат в лентата на състоянието, така че автобиографията им да изглежда конкурентна за набиращите персонал.
  • Ние генерираме Оценка на способността на всеки отделен човек, който след това се изпраща на нашите повече от 250 организации за набиране на партньори.
  • Най-накрая организираме настаняване в кампуса на всеки три месеца в Ноида, Гургаон, Ахмедабад, Бангалор и Ченай, за да настаним нашите студенти.

Най-добрата част от DataTrained е, че ние се ангажираме да ви осигурим мечтаната работа и по този начин предоставяме 100% гаранция за настаняване.

Така че, можете да станете учен по данни, дори ако нямате опит. Но трябва да притежавате това умение за числа, защото данните са всичко за числата.

Благодаря ти!


Отговор 3:

Повечето компании, които в момента наемат Data Scientist, се нуждаят незабавно от работа. Познавам компании, които имат празни постове, лежащи в продължение на 6 месеца, но не могат да намерят подходящи кандидати. Data Science е обширна и сложна област и предоставянето на обучение в офиса е много скъпо. Така че трябва да сте готови да дадете своя принос, преди да се присъедините.

Data Science не е област на изследване или област на експертиза. Това всъщност е общ термин, който се състои от различни умения. Разбивам процеса на три парчета - теория, инструменти и техники. Позволете ми да обясня всеки компонент.

Теория

Нуждаете се от здрави математически познания. Трябва да се чувствате добре със статистика, вероятност и линейна алгебра. Познаването на оптимизацията е плюс. Освен това можете да разгледате конкретен домейн като обработка на естествен език, извличане на информация, компютърна визия, биоинформатика, обработка на реч и др. Намерете добри курсове, които преподават статистика, вероятност и линейна алгебра и след това преминете към други раздели, когато ви се иска .

След това трябва да изучите разпознаването на образци и машинното обучение. Има многобройни онлайн курсове, предлагани безплатно. Присъединете се към курса на Andrew Ng по Coursera. Алтернативи са подобни курсове по Udacity и EdX. Трябва да разберете математиката зад покритите алгоритми и да сте в състояние да приложите по-опростените от тях.

Инструменти

Инструментите се състоят от езици за програмиране и действителни софтуерни инструменти. Трябва да знаете поне един математически език като Matlab, R, Python и един обикновен език за програмиране като Java (може да се използва и Python). Повечето от учените по данни, които познавам, знаят повече от 4-5 езика като тези.

Не се притеснявайте много за помощните програми на софтуера. Има многобройни обучителни институти, чийто бизнес се развива по най-новия шум в ИТ индустрията. Те биха ви отблъснали от всичко останало и биха ви накарали да се съсредоточите само върху един инструмент. Всеки месец се предлагат нови инструменти - и поне един от тях се превръща в стандарт. Ще трябва да се чувствате комфортно с Frameworks като Hadoop, Spark и т.н. Ще ви трябват двигатели за бази данни NOSQL като Cassandra, MongoDB, Neo4J и др. Тогава има подходящи инструменти като тези на SAS. Преминете към инструменти, след като вече сте добре с езиците.

Техники

Техниките идват с практически опит и проучване как другите правят нещата. Сигурно сте работили по реалистични проекти. Kaggle е перфектната платформа за това. Отидете и прекарайте времето си в работа върху Titanic Dataset. Опитайте различни алгоритми и подходи. Опитайте се да разбиете най-добрите си резултати. Преминете към други проблеми като класификация на настроенията или разпознаване на символи. Записването в магистърска програма в институт от най-високо ниво помага тук - такива проекти ще бъдат част от вашите курсове там и ще има среда, в която продължавате да се учите от другите.

Прочетете статии. Четете блогове. Чета книги. Вижте най-новото в областта. Преди две години работихме по методите на ядрото - и сега изведнъж алгоритмите за дълбоко обучение пробиват границите и дават страхотни резултати. Има много нови неща.

Екстра: Присъединете се към тази група:

https://www.facebook.com/groups/723281961067030/

Активна съм там и планирам да започна кратка видео поредица, насочена към начинаещи в Data Science. Там ще има още няколко изследователи на данни и експерти по машинно обучение. Добавете ме в Twitter:

Aditya Joshi (@ adityajoshi5) | Twitter

Публикувам за последните събития в полетата.

Можете да прочетете другите ми отговори като продължение: Как е бъдещето на големите данни / науката за данни? Трудно ли е да се намери начална работа? Каква е очакваната заплата в Индия? Какви са безплатните онлайн магистърски програми по аналитика / наука за данни? Отговор на Aditya Joshi на Какви проекти се правят от изследователите на данни? Какви са очакванията от по-свеж завършил, нает за работа на учен по данни?


Отговор 4:

Отговорът е да!

Комплект умения за изграждане на правилна основа:

Преди да можете да мислите за кандидатстване за работа, имате нужда от набор от умения за наука за данни, за да изградите правилната основа за себе си и да се уверите, че имате набор от умения, който работодателите търсят.

Безплатни онлайн курсови ресурси за наука за данни и машинно обучение:

За щастие има много ресурси за хора, които искат да научат повече за статистиката, машинното обучение или науката за данни. Например човек може да вземе безплатни онлайн курсове от платформи като Coursera, EdX и дори Udemy.

блогове за наука за данни и работни места в

Намерете работа в науката за данни, машинното обучение, задълбоченото обучение, анализ на данни, големи данни и статистика.

Вземете стаж в компании за наука за данни:

След като сте натрупали основната основа, можете да научите малко на работното място и ако става въпрос за това, дори стажовете могат да се окажат много полезни, така че определено не ги отказвайте! В някои случаи стажовете и изследователските позиции в крайна сметка могат да се превърнат в предложения за работа на пълен работен ден, ако работите усилено и проявите инициатива. По същество стажовете ще ви помогнат да придобиете повече опит, умения и опит.

Нека вашето портфолио за наука за данни се откроява:

От само себе си се разбира, че необходимите умения са необходими. Въпреки това, освен ако потенциалните работодатели не могат сами да видят с какво се занимавате, никога няма да ви осигурят работа. Ако наистина искате да се откроите, би било добре да имате силно онлайн присъствие под формата на да речем уебсайт или портфолио. Общоизвестно е, че наличието на добро портфолио е важно за намирането на работни места в областта на данните. Обаче това, което бихте включили в портфолиото си, зависи от това, което търсите. Определено би било добра идея да включите проекти, които подчертават вашите умения за кодиране в един от най-добрите езици, изисквани в обявите за работа в науката за данни - python, R и SQL.

Увеличете вашата онлайн видимост:

Така че след като сте получили необходимите умения и портфолио, можете да започнете да търсите работни места от начално ниво, като разглеждате бордове за работа, фирмени уебсайтове, както и да се свързвате с рекрутери или да изградите мрежа от контакти, за да навлезете на място. Така че като цяло можете да търсите работа чрез подбор на персонал, специализирани работни бордове, фирмени уебсайтове, общи бордове като LinkedIn, кариерни панаири, чрез приятели, семейство и колеги.

какво е науката за данните

Заключение:

Така че като цяло, ако търсите работа в областта на данните без опит. След това имайте предвид следното, за да получите начална работа в науката за данни

Не гледайте пренебрежително на стажовете. Този тип трудов опит може да доведе директно до работни места на пълен работен ден.

Поставете се както в мрежата, така и в реалния живот. Опитайте се да бъдете видими в мрежата и да участвате активно в общността. След това определено ще увеличите шансовете си да бъдете забелязани.

Направете портфолиото си благоприятно за работата, която искате.

Използвайте специалисти по подбор на персонал, специализирани бордове за работа, уебсайтове на фирми, общи бордове за работа. Като LinkedIn, панаири на кариерата, чрез приятели, семейство и колеги.

За да изградите взаимоотношения, не просто питайте хората за работа. По-скоро помислете как можете да добавите стойност и за тях. Връзките определено са двупосочна улица.


Отговор 5:

Вероятно не.

Науката за данните не е професия от начално ниво. Трябва да имате силни умения за компютърно програмиране, академично разбиране на математиката и статистиката, както и интуиция за това как данните могат да помогнат на бизнеса.

За да имате всичко това, трябва или да имате докторска степен, или да работите в индустрията и да получите количествена диплома за завършил / да присъствате на bootcamp по наука за данни.

Ако се интересувате от смяна на кариерата, разгледайте

K2 Data Science

. Ние сме онлайн bootcamp за наука за данни за работещи професионалисти. Имаме самостоятелна програма. Нашата основна учебна програма е разработена от старши специалисти по данни, а вие сте наставлявани от специалисти по данни с опит в индустрията всеки ден от пътуването.

Вероятно няма да бъдете приети, ако сте имали нулев трудов опит в автобиографията си. Предлагам ви да започнете да кандидатствате за работа като анализатор на данни или софтуерен инженер, ако целта ви е да сте учен по данни.


Отговор 6:

Имате нужда от портфолио.

Портфолио, за да заобиколите Изискване за опит

Дори за начално ниво повечето компании искат да имат хора с поне малко опит в реалния живот. Може да сте виждали мемове като този по-долу.

Въпросът е как получавате опит, ако имате нужда от опит, за да получите първата си работа? Ако има отговор, отговорът е

проекти

. Проектите са може би най-добрият заместител на трудовия опит или като

Уил Стантън

казах,

Ако нямате никакъв опит като учен по данни, значи имате абсолютно независими проекти.

Всъщност кога

Джонатан Нолис

интервюира кандидати

, той иска да чуе за описание на скорошен проблем / проект, с който сте се сблъсквали.

Искам да чуя за проект, по който са работили наскоро. Питам ги за това как е стартирал проектът, как са преценили, че си струва време и усилия, техния процес и техните резултати. Питам ги и за наученото от проекта. Печеля много от отговорите на този въпрос: ако те могат да разкажат разказ, как проблемът е свързан с по-голямата картина и как са се справили с упоритата работа, правеща нещо.

Ако нямате някакъв опит в областта на науката за данни, най-добрият вариант тук е да поговорите за проект за наука за данни, по който сте работили.

Можете да научите как да изградите портфолио за наука за данни

тук

.


Отговор 7:

Просто като изучавате предметите, които са от съществено значение за да станете учен по данни, и след това кандидатствате за стажове и длъжности. Вариантите за кариера са толкова трудни, колкото ги правите в съзнанието си. След като започнете с него, нещата ще започнат да стават по-лесни и опростени. Също така, уверете се, че знаете в какво се забърквате, тъй като много изследователи на данни дори оставят своите, след като станат изследовател на данни. Станах количествен анализатор без никакъв опит. Придобийте умения и бъдете нащрек за възможности. Уверете се, че когато намерите възможност, сте напълно готови да поемете предизвикателството.


Отговор 8:

Най-често срещаното заблуждение, което срещнах сред претендентите и неофитите в областта на науката за данни, е, че можете да се научите как да го правите, просто като се научите как да използвате някои специализирани инструменти (като R, scikit-learn, pandas, matplotlib и др.) Напълно игнорира факта, че тези инструменти представляват само малката, видима част от айсберга, а останалата част се корени в задълбочени познания за статистиката и научния метод (поради което „Учен“ се появява в заглавията на длъжностите и там поне се използва да бъде силно предпочитание да се наемат докторанти).