Vanalytics - Financial Data Analytics

  • Home
  • Vanalytics - Financial Data Analytics

Vanalytics - Financial Data Analytics Financial Data Analytics

12/07/2020

Thành công : hoàn thành công việc trong phạm vi:
- Thời gian kế hoạch
- Ngân sách kế hoạch
- Chỉ tiêu chất lượng
- Pháp lý, Đạo đức, Cộng đồng

12/07/2020

Part 2: An ML-Powered Web App in Less than 50 Lines of Code

29/06/2020

dùng thuật toán Machine Learning: Random Forest, để phân loại công ty nào có khả năng sinh lời trong năm, dựa vào 200 chỉ số tài chính. Kết quả chính xác của mô hình là 75.26% (acc). Trong đầu tư thì phương pháp này thường được gọi là phân t...

8 Proven Ways for improving the “Accuracy” of a Machine Learning Modelhttps://www.analyticsvidhya.com/blog/2015/12/impro...
22/06/2020

8 Proven Ways for improving the “Accuracy” of a Machine Learning Model
https://www.analyticsvidhya.com/blog/2015/12/improve-machine-learning-results/

Introduction Enhancing a model performance can be challenging at times. I'm sure, a lot of you would agree with me if you've found yourself stuck in a similar situation. You try all the strategies and algorithms that you've learned. Yet, you fail at improving the accuracy of your model. You feel hel...

Confusion matrix explainedhttps://www.dataschool.io/simple-guide-to-confusion-matrix-terminology/ #:~:text=A%20confusion...
21/06/2020

Confusion matrix explained
https://www.dataschool.io/simple-guide-to-confusion-matrix-terminology/ #:~:text=A%20confusion%20matrix%20is%20a,the%20true%20values%20are%20known.&text=The%20classifier%20made%20a%20total,the%20presence%20of%20that%20disease).

A confusion matrix is a table that is often used to describe the performance of a classification model (or "classifier") on a set of test data for which the true values are known. The confusion matrix itself is relatively simple to understand, but the related terminology can be

17/06/2020

A: Mỗi ngày là 1 cuộc chiến
A’: Mài bậy dồi, mỗi ngày 2 cuộc chiến lận:
TẬP THỂ DỤC THỂ THAO 2 LẦN/ NGÀY
A: OK BRO!!!

11/06/2020

CNBC Make It spoke with business executives and education experts to learn what skills workers should pick up right now.

26/05/2020

🤖⚡ scikit-learn tip #37:

New in version 0.23: Create interactive diagrams of Pipelines (and other estimators) in Jupyter!

Click on any element to see more details. You can even export the diagram to an HTML file!

See example 👇

Read all of my tips on GitHub: https://github.com/justmarkham/scikit-learn-tips

Get my best tips via email: https://scikit-learn.tips 💌

08/05/2020

A Step-by-Step Guide to Download Multiple Files Using Python

Format string python
15/04/2020

Format string python

15/04/2020

python string format
https://pyformat.info/

Python has had awesome string formatters for many years but the documentation on them is far too theoretic and technical. With this site we try to show you the most common use-cases covered by the old and new style string formatting API with practical examples.

20/03/2020

21 VIỆC NÊN LÀM TRONG MÙA COVID-19
1. Đọc hơn 700 sách giáo khoa miễn phí từ ĐH Cambridge - bit.ly/goDAS_01

2. Tham gia hơn 60 khoá học miễn phí từ ĐH Harvard - bit.ly/goDAS_02

3. Tải sách chuyên ngành miễn phí trên website của ĐH Rice và quỹ Bill Gates - bit.ly/goDAS_03

4. Học IELTS miễn phí với khoá học từ Hội đồng Anh - bit.ly/goDAS_04

5. Học tiếng Anh miễn phí với ứng dụng ELSA Pro (HS lớp 1-12) - bit.ly/goDAS_05

6. Tham gia khoá học miễn phí về Remote Working của LinkedIn - bit.ly/goDAS_06

7. Học code tại nhà miễn phí với Freecodecamp - bit.ly/goDAS_07

8. Nghe sách nói trên kho sách nói của Amazon miễn phí - bit.ly/goDAS_08

9. Tham quan hơn 500 bảo tàng và phòng tranh nổi tiếng nhất thế giới qua Google Arts & Cultures - bit.ly/goDAS_09

10. Nghe Opera trực tiếp qua live stream của nhà hát The Metropolitan Opera (New York) - bit.ly/goDAS_10

11. Nghe nhạc thiền (meditation) miễn phí trong 1 năm qua app Balance - bit.ly/goDAS11

12. Dọn dẹp toàn bộ đồ đạc theo xu hướng tối giản với Marie Kondo trên Nextfix - bit.ly/goDAS_12

13. Trải nghiệm những bộ phim hay nhất mọi thời đại trong IMDb Top 250 - bit.ly/goDAS_13

14. Hơn 500 khoá học miễn phí từ các trường Ivy League đang đợi bạn - bit.ly/goDAS_14

15. Tham gia cuộc thi phân tích dữ liệu về Covid 19 trên Kaggle - bit.ly/goDAS_15

16. Tham gia hơn 60 cuộc thi lập trình Hackathon trên Devpost - bit.ly/goDAS_16

17. Xem hàng trăm gợi ý về phim ảnh, show truyền hình, âm nhạc, game, nấu ăn, và cả... trông trẻ từ The New York Times - bit.ly/goDAS_17

18. Tải hơn 300 000 đầu sách chất lượng cao của thư viện cộng đồng New York free - bit.ly/goDAS18

19. Đọc sách "Mai dạy thống kê" miễn phí và dễ hiểu do giảng viên DAS viết - bit.ly/goDAS19

20. Họp nhóm qua Discord (max 50 người thay vì 10 người như trước) - bit.ly/goDAS_20

21. Tham gia miễn phí talkshow Áp dụng Khoa Học Dữ Liệu trong cuộc chiến với COVID 19 như thế nào? với 2 nhà khoa học người Việt ở Đan Mạch - bit.ly/goDAS_21

Nguồn: Tổng hợp

10/01/2020

Trong bài này Nhi sẽ giải thích về 2 arguments kì lạ là *args và **kwargs mà bạn hay gặp khi đọc hướng dẫn sử dụng functions trong các packages (Khi đọc lên nghe như tiếng vịt kêu :) ). Chúng là gì và có công dụng gì ?

🙏 PYTHON
29/12/2019

🙏 PYTHON

Why PYTHON?

Ngôn ngữ Python là một trong những ngôn ngữ lập trình phổ biến nhất và thuộc top các ngôn ngữ lập trình được yêu thích nhất. Rất nhiều bộ thư viện (library) sử dụng cho Python. Có hơn 147.000 package trong kho lưu trữ package dùng cho Python (thông thường được gọi là Cheese Shop), đó là những gì làm cho nó linh hoạt và rất phổ biến.

Bạn có thể sử dụng Python cho tất cả mọi thứ, từ phát triển web, khoa học dữ liệu và trực quan hóa dữ liệu, đến phát triển trò chơi và DevOps trên nền các các API, module, script, library, package của Python.

24/12/2019

Data Science CheatSheet

24/12/2019

Khoa Học Dữ Liệu trên 1 trang giấy

Great
23/12/2019

Great

Các ký hiệu bạn cần nắm rõ trong Xác suất & Thống kê - cơ sở để học các thuật toán Machine Learning và các phương pháp thống kê hiện đại.

Keep learning
23/12/2019

Keep learning

MACHINE LEARNING vs CREDIT SCORING

Trong lĩnh vực ngân hàng/ bảo hiểm, dựa trên Machine Learning có thể phát triển các ứng dụng, bao gồm Xếp hạng tín dụng (Credit Scoring), Phân tích rủi ro (Risk Analytics), Phát hiện gian lận (Fraud Detection), Bán chéo (Cross-Sell).

Qua nhiều năm, một số kỹ thuật xây dựng mô hình khác nhau để thực hiện xếp hạng tín dụng đã phát triển, bao gồm: tham số hoặc phi tham số (parametric or non-parametric), thống kê hoặc Machine Learning, các thuật toán giám sát hoặc không giám sát, mạng neuron. Các kỹ thuật gần đây gồm các cách tiếp cận rất tinh vi, sử dụng hàng trăm hoặc hàng ngàn mô hình khác nhau, các cách thức kiểm định mô hình khác nhau, đa dạng kết hợp rất nhiều thuật toán để mong đạt được kết quả với độ chính xác cao.

Mặc dù đa dạng là vậy, nhưng có một kỹ thuật xây dựng mô hình nổi bật có tên là thẻ điểm tín dụng (Credit Scorecard) được nhiều ngân hàng trên thế giới áp dụng rộng rãi (Các ngân hàng như Commonwealth Bank of Australia, Standard Chartered Bank,... cũng đang áp dụng kỹ thuật này). Thường được gọi là thẻ điểm tiêu chuẩn (Standard Scorecard), nó dựa trên Mô hình hồi quy Logistic (Logistic Regression Model). Mô hình thẻ điểm tín dụng dạng này được xây dựng đơn giản, dễ hiểu, dễ triển khai và chạy nhanh. Kết hợp giữa thống kê và Machine Learning, độ chính xác của phương pháp này tương đương với các kỹ thuật tinh vi, điểm số đầu ra của nó có thể được áp dụng trực tiếp để đánh giá xác suất nợ xấu, từ đó cung cấp đầu vào cho việc định giá nợ xấu dựa trên rủi ro. Điều này rất quan trọng đối với các bên cho vay cần tuân thủ khuôn khổ pháp lý Basel II.

Nguồn: Theo paper "Machine Learning và ứng dụng trong xếp hạng tín dụng khách hàng cá nhân của ngân hàng thương mại Việt Nam" của PGS. TS Nguyễn Hữu Tài, Trường Đại học Kinh tế Quốc dân & NCS. Đặng Hương Giang, Trường Đại học Kinh tế Kỹ Thuật Công nghiệp

20/12/2019

🐼🤹‍♂️ pandas trick #100! 🎉

Want to read a HUGE dataset into pandas but don't have enough memory?

Randomly sample the dataset *during file reading* by passing a function to "skiprows"

See example 👇

Thanks to Ted Petrou for this trick! 🙌

17/12/2019

🐼🤹‍♂️ pandas trick #98:

Problem: Your DataFrame is in "wide format" (lots of columns), but you need it in "long format" (lots of rows)

Solution: Use melt()! ⛄➡️💧

See example 👇

Long format is better for analysis, transformation, merges...

16/12/2019

🐼🤹‍♂️ pandas trick #97:

Want to convert "year" and "day of year" into a single datetime column? 📆

1. Combine them into one number
2. Convert to datetime and specify its format

See example 👇

List of all format codes: https://strftime.org/

14/12/2019

🐼🤹‍♂️ pandas trick #94:

Want to save a *massive* amount of memory? Fix your data types:

➡️ 'int8' for small integers
➡️ 'category' for strings with few unique values
➡️ 'Sparse' if most values are 0 or NaN

More info: https://pythonspeed.com/articles/pandas-load-less-data/

13/12/2019

🐼🤹‍♂️ pandas trick #95:

Want to know the *count* of missing values in a DataFrame?
➡️ df.isna().sum().sum()

Just want to know if there are *any* missing values?
➡️ df.isna().any().any()
➡️ df.isna().any(axis=None)

See example 👇

12/12/2019

Using Pandas in Python to complete data cleaning, improve your efficiency in data analysis.

09/12/2019
09/12/2019
09/12/2019

5 điều Excel không làm được hiện nay:
- Đặc điểm quan trọng nhất của Excel là nhìn trực tiếp số liệu và thấy ngay kết quả mình làm trên số liệu, nhưng thời đại ngày nay đã tạo ra một số yêu cầu/thách thức khác mà Excel chưa đáp ứng được
- Để làm những yêu cầu này, thông thường chuyên viên, quản lý phải "nhờ" đến các chuyên gia BI, Data Scientist, IT, tạo ra điểm nghẽn về tiến độ và có thể mis-communication

Những tác vụ này có thể làm được dễ dàng nếu biết R/Python

08/12/2019
08/12/2019
08/12/2019

🐼🤹‍♂️ pandas trick:

Want to create new columns (or overwrite existing columns) within a method chain? Use "assign"!

See example 👇

Address


Website

Alerts

Be the first to know and let us send you an email when Vanalytics - Financial Data Analytics posts news and promotions. Your email address will not be used for any other purpose, and you can unsubscribe at any time.

Shortcuts

  • Address
  • Alerts
  • Claim ownership or report listing
  • Want your business to be the top-listed Media Company?

Share