Initial commit, adds very basic Lexing
This commit is contained in:
commit
22e450e7e7
|
@ -0,0 +1,72 @@
|
||||||
|
|
||||||
|
# Covers JetBrains IDEs: IntelliJ, RubyMine, PhpStorm, AppCode, PyCharm, CLion, Android Studio and WebStorm
|
||||||
|
# Reference: https://intellij-support.jetbrains.com/hc/en-us/articles/206544839
|
||||||
|
|
||||||
|
# User-specific stuff
|
||||||
|
.idea/**/workspace.xml
|
||||||
|
.idea/**/tasks.xml
|
||||||
|
.idea/**/usage.statistics.xml
|
||||||
|
.idea/**/dictionaries
|
||||||
|
.idea/**/shelf
|
||||||
|
|
||||||
|
# Generated files
|
||||||
|
.idea/**/contentModel.xml
|
||||||
|
|
||||||
|
# Sensitive or high-churn files
|
||||||
|
.idea/**/dataSources/
|
||||||
|
.idea/**/dataSources.ids
|
||||||
|
.idea/**/dataSources.local.xml
|
||||||
|
.idea/**/sqlDataSources.xml
|
||||||
|
.idea/**/dynamic.xml
|
||||||
|
.idea/**/uiDesigner.xml
|
||||||
|
.idea/**/dbnavigator.xml
|
||||||
|
|
||||||
|
# Gradle
|
||||||
|
.idea/**/gradle.xml
|
||||||
|
.idea/**/libraries
|
||||||
|
|
||||||
|
# Gradle and Maven with auto-import
|
||||||
|
# When using Gradle or Maven with auto-import, you should exclude module files,
|
||||||
|
# since they will be recreated, and may cause churn. Uncomment if using
|
||||||
|
# auto-import.
|
||||||
|
# .idea/modules.xml
|
||||||
|
# .idea/*.iml
|
||||||
|
# .idea/modules
|
||||||
|
# *.iml
|
||||||
|
# *.ipr
|
||||||
|
|
||||||
|
# CMake
|
||||||
|
cmake-build-*/
|
||||||
|
|
||||||
|
# Mongo Explorer plugin
|
||||||
|
.idea/**/mongoSettings.xml
|
||||||
|
|
||||||
|
# File-based project format
|
||||||
|
*.iws
|
||||||
|
|
||||||
|
# IntelliJ
|
||||||
|
out/
|
||||||
|
|
||||||
|
# mpeltonen/sbt-idea plugin
|
||||||
|
.idea_modules/
|
||||||
|
|
||||||
|
# JIRA plugin
|
||||||
|
atlassian-ide-plugin.xml
|
||||||
|
|
||||||
|
# Cursive Clojure plugin
|
||||||
|
.idea/replstate.xml
|
||||||
|
|
||||||
|
# Crashlytics plugin (for Android Studio and IntelliJ)
|
||||||
|
com_crashlytics_export_strings.xml
|
||||||
|
crashlytics.properties
|
||||||
|
crashlytics-build.properties
|
||||||
|
fabric.properties
|
||||||
|
|
||||||
|
# Editor-based Rest Client
|
||||||
|
.idea/httpRequests
|
||||||
|
|
||||||
|
# Android studio 3.1+ serialized cache file
|
||||||
|
.idea/caches/build_file_checksums.ser
|
||||||
|
|
||||||
|
|
||||||
|
.directory
|
|
@ -0,0 +1,3 @@
|
||||||
|
[submodule "extern/Catch2"]
|
||||||
|
path = extern/Catch2
|
||||||
|
url = git@github.com:catchorg/Catch2.git
|
|
@ -0,0 +1,2 @@
|
||||||
|
<?xml version="1.0" encoding="UTF-8"?>
|
||||||
|
<module classpath="CMake" type="CPP_MODULE" version="4" />
|
|
@ -0,0 +1,5 @@
|
||||||
|
<component name="ProjectCodeStyleConfiguration">
|
||||||
|
<state>
|
||||||
|
<option name="PREFERRED_PROJECT_CODE_STYLE" value="Default" />
|
||||||
|
</state>
|
||||||
|
</component>
|
|
@ -0,0 +1,15 @@
|
||||||
|
<?xml version="1.0" encoding="UTF-8"?>
|
||||||
|
<project version="4">
|
||||||
|
<component name="CMakeWorkspace" PROJECT_DIR="$PROJECT_DIR$" />
|
||||||
|
<component name="CidrRootsConfiguration">
|
||||||
|
<sourceRoots>
|
||||||
|
<file path="$PROJECT_DIR$/src" />
|
||||||
|
</sourceRoots>
|
||||||
|
<libraryRoots>
|
||||||
|
<file path="$PROJECT_DIR$/extern" />
|
||||||
|
</libraryRoots>
|
||||||
|
</component>
|
||||||
|
<component name="JavaScriptSettings">
|
||||||
|
<option name="languageLevel" value="ES6" />
|
||||||
|
</component>
|
||||||
|
</project>
|
|
@ -0,0 +1,8 @@
|
||||||
|
<?xml version="1.0" encoding="UTF-8"?>
|
||||||
|
<project version="4">
|
||||||
|
<component name="ProjectModuleManager">
|
||||||
|
<modules>
|
||||||
|
<module fileurl="file://$PROJECT_DIR$/.idea/PorygonLang.iml" filepath="$PROJECT_DIR$/.idea/PorygonLang.iml" />
|
||||||
|
</modules>
|
||||||
|
</component>
|
||||||
|
</project>
|
|
@ -0,0 +1,7 @@
|
||||||
|
<?xml version="1.0" encoding="UTF-8"?>
|
||||||
|
<project version="4">
|
||||||
|
<component name="VcsDirectoryMappings">
|
||||||
|
<mapping directory="$PROJECT_DIR$" vcs="Git" />
|
||||||
|
<mapping directory="$PROJECT_DIR$/extern/Catch2" vcs="Git" />
|
||||||
|
</component>
|
||||||
|
</project>
|
|
@ -0,0 +1,13 @@
|
||||||
|
cmake_minimum_required(VERSION 3.13)
|
||||||
|
project(PorygonLang)
|
||||||
|
|
||||||
|
set(CMAKE_CXX_STANDARD 17)
|
||||||
|
|
||||||
|
add_subdirectory(extern/Catch2)
|
||||||
|
|
||||||
|
add_library(PorygonLang library.cpp library.h src/main.cpp src/main.h++ src/Parser/Lexer.cpp src/Parser/Lexer.hpp src/Parser/TokenKind.hpp src/Parser/Token.hpp)
|
||||||
|
add_executable(PorygonLangTests library.cpp library.h src/main.cpp src/main.h++ src/Parser/Lexer.cpp src/Parser/Lexer.hpp src/Parser/TokenKind.hpp src/Parser/Token.hpp)
|
||||||
|
target_link_libraries(PorygonLangTests Catch2::Catch2)
|
||||||
|
target_compile_definitions(PorygonLangTests PRIVATE TESTS_BUILD)
|
||||||
|
|
||||||
|
include(CTest)
|
|
@ -0,0 +1 @@
|
||||||
|
Subproject commit e680c4b9fb1d699bfad239e42ce7643d7cf00371
|
|
@ -0,0 +1,18 @@
|
||||||
|
#include "library.h"
|
||||||
|
#include <iostream>
|
||||||
|
#define CATCH_CONFIG_MAIN
|
||||||
|
|
||||||
|
unsigned int Factorial( unsigned int number ) {
|
||||||
|
return number <= 1 ? number : Factorial(number-1)*number;
|
||||||
|
}
|
||||||
|
|
||||||
|
#ifdef TESTS_BUILD
|
||||||
|
#include <catch2/catch.hpp>
|
||||||
|
|
||||||
|
TEST_CASE( "Factorials are computed", "[factorial]" ) {
|
||||||
|
REQUIRE( Factorial(1) == 1 );
|
||||||
|
REQUIRE( Factorial(2) == 2 );
|
||||||
|
REQUIRE( Factorial(3) == 6 );
|
||||||
|
REQUIRE( Factorial(10) == 3628800 );
|
||||||
|
}
|
||||||
|
#endif
|
|
@ -0,0 +1,6 @@
|
||||||
|
#ifndef PORYGONLANG_LIBRARY_H
|
||||||
|
#define PORYGONLANG_LIBRARY_H
|
||||||
|
|
||||||
|
int theAnswer();
|
||||||
|
|
||||||
|
#endif //PORYGONLANG_LIBRARY_H
|
|
@ -0,0 +1,173 @@
|
||||||
|
#include <utility>
|
||||||
|
#include <cmath>
|
||||||
|
|
||||||
|
#include "Lexer.hpp"
|
||||||
|
|
||||||
|
Lexer::Lexer(string script) {
|
||||||
|
Lexer::Script = std::move(script);
|
||||||
|
Lexer::Position = 0;
|
||||||
|
}
|
||||||
|
|
||||||
|
vector<IToken*> Lexer::Lex() {
|
||||||
|
vector<IToken*> tokens;
|
||||||
|
while (true){
|
||||||
|
IToken* next = Lexer::LexNext(Lexer::Next());
|
||||||
|
tokens.push_back(next);
|
||||||
|
if (next->GetKind() == TokenKind::EndOfFile)
|
||||||
|
break;
|
||||||
|
}
|
||||||
|
return tokens;
|
||||||
|
}
|
||||||
|
|
||||||
|
char Lexer::Peek(){
|
||||||
|
if (Lexer::Position > Lexer::Script.length())
|
||||||
|
return '\0';
|
||||||
|
return Lexer::Script[Lexer::Position];
|
||||||
|
}
|
||||||
|
|
||||||
|
char Lexer::Next(){
|
||||||
|
char next = Peek();
|
||||||
|
Lexer::Position++;
|
||||||
|
return next;
|
||||||
|
}
|
||||||
|
|
||||||
|
IToken* Lexer::LexNext(char c){
|
||||||
|
switch (c) {
|
||||||
|
case '\0':
|
||||||
|
return new SimpleToken(TokenKind::EndOfFile);
|
||||||
|
case ' ':
|
||||||
|
case '\t':
|
||||||
|
case '\n':
|
||||||
|
case '\r':
|
||||||
|
return new SimpleToken(TokenKind::WhiteSpace);
|
||||||
|
case '0': case '1': case '2': case '3': case '4': case '5': case '6': case '7': case '8': case '9':
|
||||||
|
return LexNumber(c);
|
||||||
|
default:
|
||||||
|
throw;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
int CharToInt(char c){
|
||||||
|
switch (c){
|
||||||
|
case '0': return 0;
|
||||||
|
case '1': return 1;
|
||||||
|
case '2': return 2;
|
||||||
|
case '3': return 3;
|
||||||
|
case '4': return 4;
|
||||||
|
case '5': return 5;
|
||||||
|
case '6': return 6;
|
||||||
|
case '7': return 7;
|
||||||
|
case '8': return 8;
|
||||||
|
case '9': return 9;
|
||||||
|
default: return -1;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
IToken* Lexer::LexNumber(char c){
|
||||||
|
long int_value = CharToInt(c);
|
||||||
|
double float_value = 0;
|
||||||
|
short decimal_index = 0;
|
||||||
|
bool has_point = false;
|
||||||
|
bool is_searching = true;
|
||||||
|
while (is_searching){
|
||||||
|
char next = Lexer::Next();
|
||||||
|
int next_val = CharToInt(next);
|
||||||
|
if (next_val == -1){
|
||||||
|
switch (next){
|
||||||
|
case '_': continue;
|
||||||
|
case '.':
|
||||||
|
has_point = true;
|
||||||
|
decimal_index = 0;
|
||||||
|
float_value = int_value;
|
||||||
|
continue;
|
||||||
|
default:
|
||||||
|
is_searching = false;
|
||||||
|
continue;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
else{
|
||||||
|
if (has_point){
|
||||||
|
decimal_index++;
|
||||||
|
float_value += next_val / pow(10, decimal_index);
|
||||||
|
}
|
||||||
|
else {
|
||||||
|
int_value *= 10;
|
||||||
|
int_value += next_val;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
if (has_point){
|
||||||
|
throw;
|
||||||
|
}
|
||||||
|
else{
|
||||||
|
return new IntegerToken(int_value);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
|
||||||
|
#ifdef TESTS_BUILD
|
||||||
|
#include <catch2/catch.hpp>
|
||||||
|
|
||||||
|
TEST_CASE( "When at end of script return terminator", "[lexer]" ) {
|
||||||
|
Lexer lexer = Lexer("");
|
||||||
|
REQUIRE(lexer.Peek() == '\0');
|
||||||
|
}
|
||||||
|
|
||||||
|
TEST_CASE( "Peek doesn't advance", "[lexer]" ) {
|
||||||
|
Lexer lexer = Lexer("5 + 5");
|
||||||
|
REQUIRE(lexer.Peek() == '5');
|
||||||
|
REQUIRE(lexer.Peek() == '5');
|
||||||
|
REQUIRE(lexer.Peek() == '5');
|
||||||
|
}
|
||||||
|
|
||||||
|
TEST_CASE( "Next does advance", "[lexer]" ) {
|
||||||
|
Lexer lexer = Lexer("5 + 5");
|
||||||
|
REQUIRE(lexer.Next() == '5');
|
||||||
|
REQUIRE(lexer.Next() == ' ');
|
||||||
|
REQUIRE(lexer.Next() == '+');
|
||||||
|
REQUIRE(lexer.Next() == ' ');
|
||||||
|
REQUIRE(lexer.Next() == '5');
|
||||||
|
REQUIRE(lexer.Next() == '\0');
|
||||||
|
}
|
||||||
|
|
||||||
|
TEST_CASE( "Lex Null Terminator as EOF", "[lexer]" ) {
|
||||||
|
Lexer lexer = Lexer("");
|
||||||
|
REQUIRE(lexer.LexNext('\0') -> GetKind() == TokenKind::EndOfFile);
|
||||||
|
}
|
||||||
|
|
||||||
|
TEST_CASE( "Lex Whitespace", "[lexer]" ) {
|
||||||
|
Lexer lexer = Lexer("");
|
||||||
|
CHECK(lexer.LexNext(' ') -> GetKind() == TokenKind::WhiteSpace);
|
||||||
|
CHECK(lexer.LexNext('\t') -> GetKind() == TokenKind::WhiteSpace);
|
||||||
|
CHECK(lexer.LexNext('\n') -> GetKind() == TokenKind::WhiteSpace);
|
||||||
|
CHECK(lexer.LexNext('\r') -> GetKind() == TokenKind::WhiteSpace);
|
||||||
|
}
|
||||||
|
|
||||||
|
TEST_CASE( "Lex Basic Integers", "[lexer]" ) {
|
||||||
|
Lexer lexer = Lexer("");
|
||||||
|
CHECK(lexer.LexNext('0') -> GetKind() == TokenKind::Integer);
|
||||||
|
CHECK(lexer.LexNext('1') -> GetKind() == TokenKind::Integer);
|
||||||
|
CHECK(lexer.LexNext('2') -> GetKind() == TokenKind::Integer);
|
||||||
|
CHECK(lexer.LexNext('3') -> GetKind() == TokenKind::Integer);
|
||||||
|
CHECK(lexer.LexNext('4') -> GetKind() == TokenKind::Integer);
|
||||||
|
CHECK(lexer.LexNext('5') -> GetKind() == TokenKind::Integer);
|
||||||
|
CHECK(lexer.LexNext('6') -> GetKind() == TokenKind::Integer);
|
||||||
|
CHECK(lexer.LexNext('7') -> GetKind() == TokenKind::Integer);
|
||||||
|
CHECK(lexer.LexNext('8') -> GetKind() == TokenKind::Integer);
|
||||||
|
CHECK(lexer.LexNext('9') -> GetKind() == TokenKind::Integer);
|
||||||
|
}
|
||||||
|
|
||||||
|
TEST_CASE( "Lex Longer Integers", "[lexer]" ) {
|
||||||
|
long integers[] {0,1,5,9,10,50,100,1000,99999,6484,62163,48862};
|
||||||
|
for (int integer : integers){
|
||||||
|
Lexer lexer = Lexer(std::to_string(integer));
|
||||||
|
auto tokens = lexer.Lex();
|
||||||
|
REQUIRE(tokens.size() == 2);
|
||||||
|
IToken* firstToken = tokens[0];
|
||||||
|
REQUIRE(firstToken -> GetKind() == TokenKind::Integer);
|
||||||
|
auto* integerToken = (IntegerToken *)firstToken;
|
||||||
|
CHECK(integerToken -> Value == integer);
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
#endif
|
|
@ -0,0 +1,26 @@
|
||||||
|
#ifndef PORYGONLANG_LEXER_HPP
|
||||||
|
#define PORYGONLANG_LEXER_HPP
|
||||||
|
#include <string>
|
||||||
|
#include <vector>
|
||||||
|
#include "Token.hpp"
|
||||||
|
|
||||||
|
using namespace std;
|
||||||
|
|
||||||
|
class Lexer {
|
||||||
|
string Script;
|
||||||
|
#ifdef TESTS_BUILD
|
||||||
|
public:
|
||||||
|
#endif
|
||||||
|
unsigned int Position;
|
||||||
|
char Peek();
|
||||||
|
char Next();
|
||||||
|
IToken* LexNext(char c);
|
||||||
|
IToken* LexNumber(char c);
|
||||||
|
public:
|
||||||
|
vector<IToken*> Lex();
|
||||||
|
explicit Lexer(string script);
|
||||||
|
|
||||||
|
};
|
||||||
|
|
||||||
|
|
||||||
|
#endif //PORYGONLANG_LEXER_HPP
|
|
@ -0,0 +1,37 @@
|
||||||
|
#ifndef PORYGONLANG_TOKEN_HPP
|
||||||
|
#define PORYGONLANG_TOKEN_HPP
|
||||||
|
|
||||||
|
#include "TokenKind.hpp"
|
||||||
|
|
||||||
|
class IToken{
|
||||||
|
public:
|
||||||
|
virtual TokenKind GetKind() = 0;
|
||||||
|
};
|
||||||
|
|
||||||
|
class SimpleToken : public IToken{
|
||||||
|
public:
|
||||||
|
TokenKind Kind;
|
||||||
|
|
||||||
|
explicit SimpleToken(TokenKind type){
|
||||||
|
Kind = type;
|
||||||
|
}
|
||||||
|
|
||||||
|
TokenKind GetKind() override{
|
||||||
|
return Kind;
|
||||||
|
}
|
||||||
|
};
|
||||||
|
|
||||||
|
class IntegerToken : public IToken{
|
||||||
|
public:
|
||||||
|
long Value;
|
||||||
|
|
||||||
|
explicit IntegerToken(long value){
|
||||||
|
Value = value;
|
||||||
|
}
|
||||||
|
|
||||||
|
TokenKind GetKind() override{
|
||||||
|
return TokenKind::Integer;
|
||||||
|
}
|
||||||
|
};
|
||||||
|
|
||||||
|
#endif //PORYGONLANG_TOKEN_HPP
|
|
@ -0,0 +1,12 @@
|
||||||
|
#ifndef PORYGONLANG_TOKENKIND_HPP
|
||||||
|
#define PORYGONLANG_TOKENKIND_HPP
|
||||||
|
|
||||||
|
enum TokenKind{
|
||||||
|
EndOfFile,
|
||||||
|
WhiteSpace,
|
||||||
|
|
||||||
|
Integer,
|
||||||
|
};
|
||||||
|
|
||||||
|
|
||||||
|
#endif //PORYGONLANG_TOKENKIND_HPP
|
|
@ -0,0 +1,3 @@
|
||||||
|
#include "main.h++"
|
||||||
|
|
||||||
|
|
|
@ -0,0 +1,10 @@
|
||||||
|
#ifndef PORYGONLANG_MAIN_H
|
||||||
|
#define PORYGONLANG_MAIN_H
|
||||||
|
|
||||||
|
|
||||||
|
class main {
|
||||||
|
|
||||||
|
};
|
||||||
|
|
||||||
|
|
||||||
|
#endif //PORYGONLANG_MAIN_H
|
Loading…
Reference in New Issue