[BACKEND] Allow nvptx to pass ll ir to CUDAModule (#404)

b8c8aadf · Tianqi Chen · GitHub · 50c7a01b · b8c8aadf
Commit b8c8aadf authored Aug 31, 2017 by Tianqi Chen Committed by GitHub Aug 31, 2017
Hide whitespace changes
Inline Side-by-side

Showing with 10 additions and 8 deletions

src/codegen/llvm/codegen_nvptx.cc
+10 -8

No files found.
--- a/src/codegen/llvm/codegen_nvptx.cc
+++ b/src/codegen/llvm/codegen_nvptx.cc
@@ -131,8 +131,7 @@ class CodeGenNVPTX : public CodeGenLLVM {
 };
 runtime::Module BuildNVPTX(Array<LoweredFunc> funcs, std::string target) {
-  CHECK(target.length(
+  CHECK(target.length() >= 5 &&
-) >= 5 &&
        target.substr(0, 5) == "nvptx");
  llvm::TargetMachine* tm = GetLLVMTargetMachine(
      "-mtriple=nvptx64-nvidia-cuda -mcpu=sm_20" +
@@ -144,16 +143,19 @@ runtime::Module BuildNVPTX(Array<LoweredFunc> funcs, std::string target) {
    cg->AddFunction(f);
  }
  std::unique_ptr<llvm::Module> module = cg->Finish();
-  llvm::SmallString<8> data;
+  llvm::SmallString<8> data_ptx, data_ll;
-  llvm::raw_svector_ostream dest(data);
+  llvm::raw_svector_ostream dest_ptx(data_ptx), dest_ll(data_ll);
-  dest.SetUnbuffered();
+  dest_ptx.SetUnbuffered();
+  dest_ll.SetUnbuffered();
  llvm::legacy::PassManager pass;
  CHECK(tm->addPassesToEmitFile(
-      pass, dest, llvm::TargetMachine::CGFT_AssemblyFile) == 0)
+      pass, dest_ptx, llvm::TargetMachine::CGFT_AssemblyFile) == 0)
      << "Cannot emit target CGFT_ObjectFile";
  pass.run(*module);
-  std::string ptx(data.begin(), data.end());
+  module->print(dest_ll, nullptr);
-  return CUDAModuleCreate(ptx, "ptx", ExtractFuncInfo(funcs), "");
+  std::string ptx(data_ptx.begin(), data_ptx.end());
+  std::string ll(data_ll.begin(), data_ll.end());
+  return CUDAModuleCreate(ptx, "ptx", ExtractFuncInfo(funcs), ll);
 }
 TVM_REGISTER_API("codegen.build_nvptx")