Esse repositório tem como objetivo armazenar as atividades feitas durante o processo treinee do CIS (Computational Intelligence Society), grupo de inteligência artificial da UnB.
A proposta da primeira atividade foi realizar a regressão em um dataset da escolha do participante. Para essa atividade eu escolhi o dataset “Medical Cost Personal Datasets” que apresenta informações das pessoas como idade, gênero e índice de massa corporal. Com base nesses dados eu fiz uma regressão para chegar no valor que seria cobrado pelo seguro para os custos médicos de cada indivíduo.
A proposta da segunda atividade é implementar um algoritmo KNN (K-Nearest Neighbors) do zero e aplicá-lo a um dataset de vinho. Além disso, na atividade foram explorados os modelos de aprendizado de máquina Random Forests e Decision Trees. Também foram estudadas técnicas para aumentar a quantidade de dados disponíveis, como o Oversampling.
A proposta da terceira atividade é implementar um Perceptron do zero. Nessa atividade foi possível explorar o conceito de backpropagation (algoritmo para ajustar os parâmetros da rede). Além disso, deveriamos utilizar o Perceptron para identificar fraudes bancárias. Nessa atividade também foi utilizado conceitos aprendidos anteriormente como o Oversampling.
A proposta da quarta atividade é implementar uma CNN e um modelo de NLP. Para a aplicação da CNN foi necessário estudar cada etapa da rede para assim poder criar ela usando o Tensorflow, em seguida eu fiz outra aplicação de uma CNN mais avançada utilizando a biblioteca FASTAI. Já para a aplicação do modelo de NLP foi preciso explorar formas de pré-processar um texto, fazer a tokenização dele e depos aplicar ele no modelo, no final foi utilizado um modelo com LSTM, que conseguiu obter bons resultados.