如何用JGit管理Git子模块

对于一个较大的Git工程,你可能会想在多个仓库之间共享代码,不管这些代码是在多个不同产品间使用的项目共享库或是一些模板。Git通过子模块来实现这样的需求。子模块允许将其他代码仓库的克隆作为子目录放到一个父仓库(有时候也称为父项目)中。一个子模块也是一个独立的仓库,你可以像其他仓库一样执行commit,branch,rebase等等操作。

JGit提供了实现大部分Git子模块命令的API。我将在这儿给大家介绍这些API。

设置

本文中用到的代码片段将作为学习测试程序。简单的测试程序有助于理解第三方库是如何工作,以及如何使用新的API。你可以将这些测试程序看做是可控制的试验,帮助你更加直观地发现第三方代码是如何执行的。

除此之外,如果你保持编写测试程序,可以帮助你检验第三方代码的新版本。如果你的测试程序涵盖了如何调用这些库,那么第三方代码中不兼容的修改将会尽早展现出来。

回到之前的话题,所有的测试程序共享同一个设置,详细信息请查看源代码。现在有一个空的仓库,叫parent,以及另一个仓库叫library。测试程序中,library将会作为子模块添加到parent仓库中。library仓库初始化提交了一个readme.txt文件。测试程序中有一个setUp方法,用来创建这两个仓库,如下所示:

1

Git git = Git.init().setDirectory( “/tmp/path/to/repo” ).call();

这两个仓库用类型为Git的parent和library变量表示。该类封装了一个仓库并允许访问JGit的所有可用指令。就如较早之前我在这里中提到,每个Commnad类对应于一条原生的Git pocelain指令。调用一个指令需要用到生成器模式。举个例子,执行Git.commit()的结果实际上相当于一个CommitCommand。你可以提供一些必要的参数去调用它的call()方法,从而执行相应的指令。

添加一个子模块

第一步当然是在一个已有的仓库添加子模块。通过上面提到的setUp步骤,library仓库应当作为子模块添加到parent仓库的modules/library目录下。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

@Test

public void testAddSubmodule() throws Exception {

String uri

= library.getRepository().getDirectory().getCanonicalPath();

SubmoduleAddCommand addCommand = parent.submoduleAdd();

addCommand.setURI( uri );

addCommand.setPath( “modules/library” );

Repository repository = addCommand.call();

repository.close();

F‌ile workDir = parent.getRepository().getWorkTree();

F‌ile readme = new F‌ile( workDir, “modules/library/readme.txt” );

F‌ile gitmodules = new F‌ile( workDir, “.gitmodules” );

assertTrue( readme.isF‌ile() );

assertTrue( gitmodules.isF‌ile() );

}

SubmoduleAddCommand对象需要知道两件事,第一是子模块从哪里克隆而来,第二是它应该存放在哪里。URI属性表示仓库库的克隆地址,这个克隆地址将会传递给clone命令。path属性则指定了相对于parent仓库根工作目录的路径,子模块将被存放在这个路径。这个指令执行之后,parent仓库的工作目录将会变成这样:

library仓库存放在modules/library目录下,而且它的工作目录树被检出。call()方法返回一个Repository对象,你可以把它当做一个常规的仓库来使用。这也意味着,你必须在程序中明确显式地关闭返回的仓库,以避免文件句柄泄露。

从上图我们可以看到,SubmoduleAddCommand做了一件事,它在parent仓库的根工作目录下创建了一个.git模块文件,并把它添加到索引中。

1

2

3

[submodule “modules/library”]

path = modules/library

url = git@example.com:path/to/lib.git

如果你打开过Git的配置文件,你会发现以上句法。这个文件列出了当前仓库的所有子模块。对于每个模块,文件中列出了它仓库URL地址以及本地路径。一旦commit并push了这个文件,克隆这个仓库的一方就知道哪里可以获取相应的子模块(稍后会详细讲解)。

列出子模块

当我们添加了一个子模块之后,我们可以会想知道,它是否对于父仓库来说是可知的。第一项测试中我们做了一个基础的检测,验证了某些文件和目录的存在。我们也可以使用一个API来列出一个仓库的子模块,如下所示:

1

2

3

4

5

6

7

8

9

10

11

@Test

public void testListSubmodules() throws Exception {

addLibrarySubmodule();

Map<String,SubmoduleStatus> submodules

= parent.submoduleStatus().call();

assertEquals( 1, submodules.size() );

SubmoduleStatus status = submodules.get( “modules/library” );

assertEquals( INITIALIZED, status.getType() );

}

SubmoduleStatus命令返回了一个子模块的Map集合,其中键是子模块的路径,值是这个模块的状态值。通过以上代码我们能够验证子模块确实已经添加进去,而且它的状态是INITIALIZED的。这个命令还允许添加一个或多个路径来限制子模块状态。

说到状态,JGit的StatusCommand并非原生的Git指令。如果在执行指令时添加选项‐‐ignore-submodules=dirty,那么所有对子模块工作目录的修改都会被忽略。

更新子模块

子模块通常指向他们所在的仓库的一次特殊的提交。如果之后有人克隆了父仓库,他们也会获得与之完全相同的子模块状态,即便子模块的上游有新的提交。

为了修改子模块,你像一下代码一样明确地对其进行更新:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

@Test

public void testUpdateSubmodule() throws Exception {

addLibrarySubmodule();

ObjectId newHead = library.commit().setMessage( “msg” ).call();

File workDir = parent.getRepository().getWorkTree();

Git libModule = Git.open( new F‌ile( workDir, “modules/library” ) );

libModule.pull().call();

libModule.close();

parent.add().addF‌ilepattern( “modules/library” ).call();

parent.commit().setMessage( “Update submodule” ).call();

assertEquals( newHead, getSubmoduleHead( “modules/library” ) );

}

这个较长的代码片段中,首先第一件事就是提交一些东西到library仓库中(第四行),接着将子模块更新到最近的一次提交。

而只有在充满了艰辛的人生旅途中,

如何用JGit管理Git子模块

相关文章:

你感兴趣的文章:

标签云: